上周,GPT-4o的Her突然向用户开放,这也意味着多模态在AI拟人互动发展上已经到下一个高度了!前不久Open Ai发布了小模型 GPT-4o mini,直接替代了GPT3.5turbo,在多模态推理方面,GPT-4o mini 更是大放异彩。9 g9 |8 S6 |0 x2 t: [5 K1 t+ S2 ^ `
6 ? d( G% k" ~+ l$ I实现这些AI工具共情的基础在于让其拥有强大的多模态情感识别能力,在功能上从单纯的「任务执行者」进化到「满足人类情感需求的陪伴者」,多模态大模型的落地应用离我们的生活越来越近,这也让多模态一跃成为2024的顶会大魔头。0 j7 F3 z. V4 j3 q+ H" [
6 l% r1 Y; s* `! |( v. [
我特意整理了多模态大模型技术路线梳理(论文+代码)+多模态顶会论文800篇+ICML 2024顶会论文解析+学透多模态大模型系列课+多个多模态顶会idea,免费分享给大家!
: h$ E- L, m* q8 T5 }8 X6 A
" J1 j/ E: w, ]* x扫码回复“多模态”
# C/ ^& U; P6 V4 `; h8 Y" ]* \领取多模态学习大礼包
% V" j6 h3 Z6 K. y3 S3 P) [# c- }1 k
4uwcp2vrqcn6403275346.png
& Q n8 W4 E* c9 p) \- C; ~0 L
/ F& |* t) I. ?3 S; Y
' t5 Z. A; ?# V7 y1 K0 X
uvwfulw4w2u6403275447.png
- H) l7 H4 \ d% g) w5 B! O视频内容已成为人们日常生活中获取信息和娱乐的主要方式之一。近年来,在顶会CVPR上,视频理解相关的论文数量有显著增加。
6 P$ @9 R5 H% L1 T, d, i已被ICML 2024录用为Oral paper——Video-of-Thought,受思维链的启发,提出从感知到认知的逐步递进方法,加速理解视频。) `! T9 A- `! [9 N) l2 s/ s4 j
这次我邀请了在头部互联网企业研发多模态大模型的Geoff老师,给大家详细解读Video-of-Thought论文,讲解顶会论文的创新格局和写作方法。
* {+ V p: C; r% h) P% O
$ a: G5 {* D& ]2 q
tyeywghktx36403275547.jpg
$ y- E# U6 j& }
扫码回复“多模态”
7 W! C# E, s" Z+ U. a" v7 |' |8 Y7 K' f预约顶会论文解析公开课5 _# o. o, J. H9 x3 k/ p+ [
/ L! ]+ C2 J0 z$ P, P8 j/ |, Y8 V' N4 i# k* Y" O( k8 i! P
另外我还给大家准备了《11小时吃透多模态大模型系列课程》,含前沿技术+审稿人讲解+顶会idea!7 s) U/ H8 k8 e, P
9 m4 ~3 H9 R; ]" p% C
1nvw0zuz5lk6403275647.jpg
6 k9 X- ]/ w2 g/ I8 R# y8 h1 R扫码回复“多模态”% g @6 \* m. Q5 Q
解锁多模态大模型系列课
7 b, w c( U9 C: D+ c' h0 w3 a# a) g) n. M9 {
k: M3 ]4 l/ \2 ]; ^7 N& M文末福利
. C+ k \3 J9 O3 D6 R
# F E1 R( D& O# V7 p" l- J6 n* h
6 |, H: l8 Q' t3 w. ^' N5 |趁热打铁,宣传一下Geoff老师的2V3小班,这次单独给我这边粉丝最低优惠价!!!
( Z9 e- \3 S' `( |/ u' u, P
" ?: f( T& m/ n2 jGeoff老师真的非常有实力!他已经执导过多名同学顺利发表论文,且毕业后一直在头部互联网企业研发多模态大模型。谷歌学术引用2000+,获得2项国际专利授权,研发的技术被头部互联网大厂应用。发表30余篇国际会议&期刊论文,包括顶会CVPR、ECCV、顶刊TNNLS、UCV等,担任TPAMI、TIP、CVPR、ICCV、ECCV审稿人。) b* f. \: f% A. I9 n% n
fp32e2ee1vg6403275747.jpg
# c* a G6 G, N- m+ i, L6 z& h6 T( J0 ^- `6 r' J3 }7 I' ]
扫码回复“小班”立项8月专属最低价
8 X# n1 P M! [, @* ~报名即可免费使用沃研Turbo科研大模型
. ^1 G) X5 a4 ]
, ^ W5 z4 B: O9 T: I
/ l* g) z, d( `% x- g* b
uvqavy5u15z6403275848.png
2 G: p( ]) q1 m1 z
沃恩智慧 |