上周,GPT-4o的Her突然向用户开放,这也意味着多模态在AI拟人互动发展上已经到下一个高度了!前不久Open Ai发布了小模型 GPT-4o mini,直接替代了GPT3.5turbo,在多模态推理方面,GPT-4o mini 更是大放异彩。
# t* s0 D" b& S% X, p L0 S8 K, G! P$ K( U& {$ @7 j
实现这些AI工具共情的基础在于让其拥有强大的多模态情感识别能力,在功能上从单纯的「任务执行者」进化到「满足人类情感需求的陪伴者」,多模态大模型的落地应用离我们的生活越来越近,这也让多模态一跃成为2024的顶会大魔头。" D( W5 m2 M4 h
& `7 D" E# T6 j8 y8 u7 D0 H2 S我特意整理了多模态大模型技术路线梳理(论文+代码)+多模态顶会论文800篇+ICML 2024顶会论文解析+学透多模态大模型系列课+多个多模态顶会idea,免费分享给大家!
! o1 D$ u! N5 I3 d `: P$ ? \5 l* W7 Q* G
扫码回复“多模态”/ `- Y/ L1 i/ |2 {' e/ C
领取多模态学习大礼包
/ e: K/ \: I, ^! }" l! `
mey2jc0e2uj64027882843.png
2 l$ l5 N/ l$ S& `4 K4 ?# L; v N* d/ \! E9 `5 x9 b
- I l' V7 D: w
bpp4wzpgj2y64027882944.png
1 S8 z) b6 c) j2 y
视频内容已成为人们日常生活中获取信息和娱乐的主要方式之一。近年来,在顶会CVPR上,视频理解相关的论文数量有显著增加。" D/ A% ?( d1 }7 G4 E& v" x
已被ICML 2024录用为Oral paper——Video-of-Thought,受思维链的启发,提出从感知到认知的逐步递进方法,加速理解视频。
1 \9 [; J9 O. v$ Z这次我邀请了在头部互联网企业研发多模态大模型的Geoff老师,给大家详细解读Video-of-Thought论文,讲解顶会论文的创新格局和写作方法。7 `: R% W, \/ Y% A. f" Q: i
, ~; }4 C+ P# B; P
554rpudbv0o64027883044.jpg
$ X- d$ O- x* u |6 @: ~1 y, T扫码回复“多模态”' Q0 j) U& t5 [( s6 u
预约顶会论文解析公开课
x0 ~0 x8 x( T* S+ Y
. C- L! \$ F: T- ^% Z, \ J4 d, P. ? {
另外我还给大家准备了《11小时吃透多模态大模型系列课程》,含前沿技术+审稿人讲解+顶会idea!
" Q/ x' G1 u: `) F0 @* m1 ^# D) e& y
pasqftqkrz264027883144.jpg
0 K4 g' ^9 T8 ] q; N/ p p* i! f
扫码回复“多模态”6 @* {8 L$ a: A9 k1 m" N
解锁多模态大模型系列课
" I3 ?" i8 I% X9 i6 Q7 [ v) R
. V% d( ^- U+ }! {* E. @/ r: ]% ^" `
文末福利% ]5 F4 k8 N- P$ x: K, C
; o+ L/ x8 v: q3 o
# u9 W7 O/ ^7 N4 d% [, P2 x
趁热打铁,宣传一下Geoff老师的2V3小班,这次单独给我这边粉丝最低优惠价!!!
& B: g! G, A/ C) d. I# u" [6 S _; d4 G# o( {0 i1 D
Geoff老师真的非常有实力!他已经执导过多名同学顺利发表论文,且毕业后一直在头部互联网企业研发多模态大模型。谷歌学术引用2000+,获得2项国际专利授权,研发的技术被头部互联网大厂应用。发表30余篇国际会议&期刊论文,包括顶会CVPR、ECCV、顶刊TNNLS、UCV等,担任TPAMI、TIP、CVPR、ICCV、ECCV审稿人。7 t$ A6 K3 q. I' n: z
waggmnktbpo64027883244.jpg
0 @4 t D# i6 b# N3 A8 ^; r2 }1 _2 H' a R1 j; g' v
扫码回复“小班”立项8月专属最低价
& T5 ~5 W7 W9 M/ X2 U* A3 E- b8 c报名即可免费使用沃研Turbo科研大模型 `; l6 V+ h6 ]# u! d
% u6 E3 E4 a6 N8 p; \) A6 T: d% Z; o* \9 p
bei44s2wgla64027883345.png
# T7 u' v3 v1 L0 \; V沃恩智慧 |