上周,GPT-4o的Her突然向用户开放,这也意味着多模态在AI拟人互动发展上已经到下一个高度了!前不久Open Ai发布了小模型 GPT-4o mini,直接替代了GPT3.5turbo,在多模态推理方面,GPT-4o mini 更是大放异彩。6 c9 |$ T# M$ L. t2 c
; R5 f+ X/ N8 c* \: P实现这些AI工具共情的基础在于让其拥有强大的多模态情感识别能力,在功能上从单纯的「任务执行者」进化到「满足人类情感需求的陪伴者」,多模态大模型的落地应用离我们的生活越来越近,这也让多模态一跃成为2024的顶会大魔头。
+ i' Q1 e* s; y7 A' t2 D) N5 d! h- |' J" B
我特意整理了多模态大模型技术路线梳理(论文+代码)+多模态顶会论文800篇+ICML 2024顶会论文解析+学透多模态大模型系列课+多个多模态顶会idea,免费分享给大家!
" }3 I) z9 K. V! |3 j1 U
" {7 b5 k+ @6 Q: G: N/ \扫码回复“多模态”% k$ X, B, j& ^5 S I& O
领取多模态学习大礼包
0 a) I% G& { s- ? ~
ndlzcwcdpru64018060944.png
8 V8 F* c& r( p" @1 r3 A
9 N* |0 j6 y# M7 |6 q8 f6 d' @) J, B
1njd3dua3rk64018061044.png
7 g; M! C. v# Q* M+ P% D, |, i视频内容已成为人们日常生活中获取信息和娱乐的主要方式之一。近年来,在顶会CVPR上,视频理解相关的论文数量有显著增加。; _: d, D! e2 G- o3 |% ~5 Y9 T
已被ICML 2024录用为Oral paper——Video-of-Thought,受思维链的启发,提出从感知到认知的逐步递进方法,加速理解视频。, A& W* Z" N/ f9 i' b
这次我邀请了在头部互联网企业研发多模态大模型的Geoff老师,给大家详细解读Video-of-Thought论文,讲解顶会论文的创新格局和写作方法。
% i# ~# o C5 _5 A1 G, M+ p0 U" g2 B5 u: i! f' |% z
xb44vgi5kgc64018061144.jpg
* i) ?. A* P* \2 ?扫码回复“多模态”/ ~0 l Q. K% e" ~7 V! m6 e
预约顶会论文解析公开课
; g3 x4 s/ }$ v6 _& T2 |6 h: \& F0 B: R: F( {" o
3 L# h: O% K5 e另外我还给大家准备了《11小时吃透多模态大模型系列课程》,含前沿技术+审稿人讲解+顶会idea!
* _& D/ V0 p6 D+ T1 k5 m2 i( `; L& \) M# ]% R- H. W, }' D
rhwv0bryfxj64018061244.jpg
( G' Q9 J8 ^" t! g! T/ a+ x扫码回复“多模态”
/ i; A+ a" _* ]9 |) X" Z解锁多模态大模型系列课; X* w- `6 N+ R+ p" b% H
$ m# ?% b8 e* _2 R8 T1 J K
5 _3 @/ \( [$ V: }, a2 M
文末福利$ d, w! e( M, `0 I. ~
8 @ A5 m4 ]/ d1 f
4 m! b0 n* V2 @' s3 V2 F趁热打铁,宣传一下Geoff老师的2V3小班,这次单独给我这边粉丝最低优惠价!!!
; \1 D, f& ~8 _' k. t$ `5 |1 F
Geoff老师真的非常有实力!他已经执导过多名同学顺利发表论文,且毕业后一直在头部互联网企业研发多模态大模型。谷歌学术引用2000+,获得2项国际专利授权,研发的技术被头部互联网大厂应用。发表30余篇国际会议&期刊论文,包括顶会CVPR、ECCV、顶刊TNNLS、UCV等,担任TPAMI、TIP、CVPR、ICCV、ECCV审稿人。' z9 ~5 C- [- }6 \- U3 V
zlaeu5wfxt064018061344.jpg
5 T+ U1 P- e4 W- t$ S* W ]) W( N& c \/ w8 P2 X3 @+ n" R% |
扫码回复“小班”立项8月专属最低价
/ g8 S! _3 h% @4 s+ a0 q报名即可免费使用沃研Turbo科研大模型
* N$ _: T: R1 |+ W5 k: Z; n9 Y. _
+ t' y- u- K1 K5 G: ]
vblvzpiw0qb64018061445.png
?3 \% H* _; G2 ]2 V
沃恩智慧 |