上周,GPT-4o的Her突然向用户开放,这也意味着多模态在AI拟人互动发展上已经到下一个高度了!前不久Open Ai发布了小模型 GPT-4o mini,直接替代了GPT3.5turbo,在多模态推理方面,GPT-4o mini 更是大放异彩。 R0 k( A$ l$ I c! U
- [/ a/ I4 b" k1 G实现这些AI工具共情的基础在于让其拥有强大的多模态情感识别能力,在功能上从单纯的「任务执行者」进化到「满足人类情感需求的陪伴者」,多模态大模型的落地应用离我们的生活越来越近,这也让多模态一跃成为2024的顶会大魔头。' }: n1 M# W) o: j8 f- y j: C
+ @, g' x f+ }8 w+ A2 v
我特意整理了多模态大模型技术路线梳理(论文+代码)+多模态顶会论文800篇+ICML 2024顶会论文解析+学透多模态大模型系列课+多个多模态顶会idea,免费分享给大家!
1 y6 y6 W E- d3 G5 h! ?' `+ B% Z' K2 T$ x, X2 V
扫码回复“多模态”
6 {- W8 X0 [4 M8 V领取多模态学习大礼包! x. z7 }/ n. G+ R( h* D
iri3h0vfped64024897034.png
; j% \3 O7 K9 m+ w' m
% q# x+ W: Y- i
/ B4 K* Q/ b' \# A% q7 v
htadurkufzv64024897134.png
- N6 S9 g6 L3 @" |. v视频内容已成为人们日常生活中获取信息和娱乐的主要方式之一。近年来,在顶会CVPR上,视频理解相关的论文数量有显著增加。$ ^2 F4 N8 j0 S) m( G
已被ICML 2024录用为Oral paper——Video-of-Thought,受思维链的启发,提出从感知到认知的逐步递进方法,加速理解视频。- i) f0 J) C" f" a8 R* u
这次我邀请了在头部互联网企业研发多模态大模型的Geoff老师,给大家详细解读Video-of-Thought论文,讲解顶会论文的创新格局和写作方法。5 e) e' d5 ~. q4 V) e9 {
3 t/ o- U9 y7 b% J
dihg032sy4x64024897234.jpg
, N$ \7 ^9 x& T; ]
扫码回复“多模态”2 r* N8 @/ H+ e8 h* X' h
预约顶会论文解析公开课
/ O3 s6 v3 m; { ^4 Q0 `" r# T6 @: N5 N; p: \
H: T4 Q2 |# V/ E. J8 c另外我还给大家准备了《11小时吃透多模态大模型系列课程》,含前沿技术+审稿人讲解+顶会idea!
) U' w% C1 M, m# }
Z8 m" U7 p& x' Q5 b# ?
qnmsznhofee64024897334.jpg
* d H) X# i! o1 S9 `
扫码回复“多模态”
+ [' |5 v4 l3 G. k解锁多模态大模型系列课5 w t) Y3 H/ \* c5 V5 f
: B3 `0 A h8 f7 P+ x
" D$ Y* z% t: m; A0 L6 U文末福利
9 [2 l' r6 y z6 r& }; H( Y! L$ a3 J
# J- Y/ ?# E1 G' k1 N1 i
趁热打铁,宣传一下Geoff老师的2V3小班,这次单独给我这边粉丝最低优惠价!!!' o( o& C Z: V
3 o: e/ A Q6 F2 P! s% k& rGeoff老师真的非常有实力!他已经执导过多名同学顺利发表论文,且毕业后一直在头部互联网企业研发多模态大模型。谷歌学术引用2000+,获得2项国际专利授权,研发的技术被头部互联网大厂应用。发表30余篇国际会议&期刊论文,包括顶会CVPR、ECCV、顶刊TNNLS、UCV等,担任TPAMI、TIP、CVPR、ICCV、ECCV审稿人。
6 n& d8 z/ m9 X3 D
uq45ovhvrjb64024897434.jpg
2 v# ^4 R3 e+ K! U( z
' S8 D1 |2 j0 L; I) C j扫码回复“小班”立项8月专属最低价. r: q2 C/ ~: T% |4 d8 e# ~' F
报名即可免费使用沃研Turbo科研大模型
; R. ]: a$ H, `: Z: m5 u
6 [4 t0 {) O1 w1 c: b; \& ]
7 u: {6 t. e7 B# D$ U Q
p2dlsc4mpba64024897535.png
0 t% L7 O! s; g1 @& G沃恩智慧 |