上周,GPT-4o的Her突然向用户开放,这也意味着多模态在AI拟人互动发展上已经到下一个高度了!前不久Open Ai发布了小模型 GPT-4o mini,直接替代了GPT3.5turbo,在多模态推理方面,GPT-4o mini 更是大放异彩。8 j, m# @/ E9 Q1 z( ~
3 J0 K* ?) w) y& W9 l6 ?实现这些AI工具共情的基础在于让其拥有强大的多模态情感识别能力,在功能上从单纯的「任务执行者」进化到「满足人类情感需求的陪伴者」,多模态大模型的落地应用离我们的生活越来越近,这也让多模态一跃成为2024的顶会大魔头。
3 Q4 A$ j2 ]9 t' A7 R2 e
0 M' y. E+ f* i) x$ l+ H/ o M我特意整理了多模态大模型技术路线梳理(论文+代码)+多模态顶会论文800篇+ICML 2024顶会论文解析+学透多模态大模型系列课+多个多模态顶会idea,免费分享给大家!/ ?3 O( l" a1 D0 z1 ~
7 F( S6 Q1 o, _: b d8 L1 k/ y# w& k$ d5 u扫码回复“多模态”9 t! ]& K+ u3 v: X
领取多模态学习大礼包
9 V9 w1 H6 w9 g& d
xas1pdexjzk6405996944.png
9 h. j1 \; s/ v: T
' H0 K' L" Q1 ?. K
6 y( Y' j; }- c
spfsextrrfg6405997044.png
2 ~# t5 C6 E5 k) O k+ g
视频内容已成为人们日常生活中获取信息和娱乐的主要方式之一。近年来,在顶会CVPR上,视频理解相关的论文数量有显著增加。! g& J a) q y9 {( q9 i
已被ICML 2024录用为Oral paper——Video-of-Thought,受思维链的启发,提出从感知到认知的逐步递进方法,加速理解视频。
5 j9 i) c) s. Z5 b; B& z2 W" m" o/ ^这次我邀请了在头部互联网企业研发多模态大模型的Geoff老师,给大家详细解读Video-of-Thought论文,讲解顶会论文的创新格局和写作方法。- U5 F- h0 B$ R" b4 c+ |1 _8 h% d
t$ c" g+ E- B/ C7 n
d0thaampm3d6405997144.jpg
/ S, o+ M5 [. ~7 W+ H' j
扫码回复“多模态”
# g2 q l- z ]. Z% H# _2 d. Y预约顶会论文解析公开课
' d5 m) y* C/ N, J0 C5 w/ {5 w% Q0 a4 x% N/ E
8 @. h. m5 W% s* l6 j5 X' A/ |另外我还给大家准备了《11小时吃透多模态大模型系列课程》,含前沿技术+审稿人讲解+顶会idea!
@, }' m* F1 p/ J( F& P
2 N$ K8 j" Y0 Z) t9 R; [0 l+ D
5wmr1p5f4f16405997244.jpg
! t3 A# d. J) A扫码回复“多模态”! R* S9 G% x% b6 w- R, F
解锁多模态大模型系列课8 s6 d# \# V/ X
1 Z$ [2 n5 h. k8 K
6 K1 ]. w; K% o M& |& Y文末福利1 k( z6 D) ]2 t; M6 E" r: D: ~
# T1 f& y* D7 e- W2 q9 ?% A% l9 C
) z5 y, }& e' E' j1 I
趁热打铁,宣传一下Geoff老师的2V3小班,这次单独给我这边粉丝最低优惠价!!!' k' F7 [ @% y: P# x/ [& H. ]/ E
# Q/ M! r1 M9 ^Geoff老师真的非常有实力!他已经执导过多名同学顺利发表论文,且毕业后一直在头部互联网企业研发多模态大模型。谷歌学术引用2000+,获得2项国际专利授权,研发的技术被头部互联网大厂应用。发表30余篇国际会议&期刊论文,包括顶会CVPR、ECCV、顶刊TNNLS、UCV等,担任TPAMI、TIP、CVPR、ICCV、ECCV审稿人。
* v; D' z- H+ Y
wiljqptbsij6405997344.jpg
" [6 _) G9 f; l2 D9 m, F. ?, N+ K% `; ]( J
扫码回复“小班”立项8月专属最低价1 k, R7 O+ q% e6 D& f3 l, O3 E
报名即可免费使用沃研Turbo科研大模型7 u; n& m+ q7 K
' s3 g7 o1 i" V6 B0 D3 ~( d6 n2 R4 N6 }
dvdzmh3y2lf6405997445.png
' S- @" q0 C( x
沃恩智慧 |