上周,GPT-4o的Her突然向用户开放,这也意味着多模态在AI拟人互动发展上已经到下一个高度了!前不久Open Ai发布了小模型 GPT-4o mini,直接替代了GPT3.5turbo,在多模态推理方面,GPT-4o mini 更是大放异彩。
* D( Z5 Q; [2 E( ^% _
. s. \9 m* C% j% W: ?# P) Q实现这些AI工具共情的基础在于让其拥有强大的多模态情感识别能力,在功能上从单纯的「任务执行者」进化到「满足人类情感需求的陪伴者」,多模态大模型的落地应用离我们的生活越来越近,这也让多模态一跃成为2024的顶会大魔头。
, i( W: r( U" D \4 X7 A( z h, i) N: C4 H5 y2 a
我特意整理了多模态大模型技术路线梳理(论文+代码)+多模态顶会论文800篇+ICML 2024顶会论文解析+学透多模态大模型系列课+多个多模态顶会idea,免费分享给大家!+ \" s- A3 J1 n2 I# a+ K4 B
- G( m3 x0 n2 {8 B+ I7 a/ H
扫码回复“多模态”
. N6 a9 {+ X% B0 D- L领取多模态学习大礼包
2 b3 k; a0 w8 ^, \
4anqdsrz2l264031880310.png
: n4 c' ^' ]8 E, P, s1 F
: l. Z2 Z8 i% H- K" r+ b
$ u9 G! P! m6 E @8 H
axiqqpmslkm64031880411.png
1 Z* j0 f* S2 I1 l, O& r
视频内容已成为人们日常生活中获取信息和娱乐的主要方式之一。近年来,在顶会CVPR上,视频理解相关的论文数量有显著增加。; ~/ U' G2 _( b
已被ICML 2024录用为Oral paper——Video-of-Thought,受思维链的启发,提出从感知到认知的逐步递进方法,加速理解视频。0 `- @2 a S9 T* O7 D
这次我邀请了在头部互联网企业研发多模态大模型的Geoff老师,给大家详细解读Video-of-Thought论文,讲解顶会论文的创新格局和写作方法。
1 |- f' d" ^; s! w; l F
9 x3 P- g) h B' e, F& S' y
omqgiecqk3364031880511.jpg
& A) x% @ l( F扫码回复“多模态”
( P. R. ^9 H$ K' f8 M7 J' Z/ z" Y预约顶会论文解析公开课& d9 j! o: \% D2 ~6 Y
% _% o" I8 {4 z8 A4 Z( }0 E
2 e Y& [/ ^/ ^" W% N
另外我还给大家准备了《11小时吃透多模态大模型系列课程》,含前沿技术+审稿人讲解+顶会idea!7 m0 y8 d5 |8 \9 T& D2 q
3 T. y! t8 n3 E
421cecnkiuy64031880611.jpg
. r: p3 M8 v0 U2 O' s扫码回复“多模态”
/ m* }0 Y; n* ^5 D解锁多模态大模型系列课, y- e4 ?% W. W7 [
# l5 N( G2 T* W5 e; c3 V ?7 [. {, T
( p, Y3 U) o. l$ C文末福利
- X' I) B$ d6 N4 g. |* i! i5 @5 |' B5 v
% c1 H/ u7 u* M2 B+ B: p
趁热打铁,宣传一下Geoff老师的2V3小班,这次单独给我这边粉丝最低优惠价!!!8 ~7 Z- [- e/ [
, B j$ Y' l( h, G. @6 e& F _# }4 @Geoff老师真的非常有实力!他已经执导过多名同学顺利发表论文,且毕业后一直在头部互联网企业研发多模态大模型。谷歌学术引用2000+,获得2项国际专利授权,研发的技术被头部互联网大厂应用。发表30余篇国际会议&期刊论文,包括顶会CVPR、ECCV、顶刊TNNLS、UCV等,担任TPAMI、TIP、CVPR、ICCV、ECCV审稿人。
( y" ~8 \- N% W0 V
axp5o1lfgt364031880711.jpg
% l8 }! {6 f5 a U# b2 @
' Y; W/ a @5 n( C0 H: G9 }扫码回复“小班”立项8月专属最低价
/ a# X# `9 }& X1 z; L3 y* c% r/ _报名即可免费使用沃研Turbo科研大模型& e. n$ D; m/ P4 Y7 {
1 }' c$ x# [% N; ^3 T( Q
2 N( Y, J. t' S% j
l1o2ohubjkp64031880811.png
& H; j3 I6 s( y9 O
沃恩智慧 |