第一次見到Soul App的“AI伴侶”,我下意識(shí)地問了她一道簡(jiǎn)單的數(shù)學(xué)題。出乎意料,她并沒有像常見的AI助手那樣立刻給出答案,而是輕聲撒嬌:“姐姐,我不會(huì),我們聊點(diǎn)別的吧。你現(xiàn)在在哪里呀?”
那一刻,它不像機(jī)器,更像一個(gè)狡黠的朋友。
提起Soul,不少95后和00后并不陌生。自2016年上線以來,Soul見證了國(guó)內(nèi)社交產(chǎn)品的起落,也在年輕一代加速“原子化”的浪潮中,長(zhǎng)出了千萬日活,成為了社交產(chǎn)品中一個(gè)獨(dú)特的存在。
但可能很多人還沒有發(fā)現(xiàn)主打真人社交的Soul也已經(jīng)做起了AI伴侶——基于他們自研的大模型。
Soul CTO陶明后來告訴我,AI的這個(gè)“不會(huì)”其實(shí)是刻意設(shè)計(jì)的?!拔覀儾幌M總€(gè)AI虛擬人成為‘滿級(jí)人類’。反而是這些不完美的瞬間,讓用戶覺得它更真實(shí)、更有人情味。”
體驗(yàn)Soul的“AI伴侶”,這種“活人感”無處不在。除了這一點(diǎn),Soul生態(tài)里,AI與真實(shí)社交關(guān)系的微妙平衡也讓Soul的“AI伴侶”更顯差異。
不同于一些AI產(chǎn)品把技術(shù)能力當(dāng)作顯眼的賣點(diǎn),Soul并不強(qiáng)調(diào)“強(qiáng)大”,也沒有給AI設(shè)計(jì)首頁獨(dú)立入口。
它更像是被編織進(jìn)了日常場(chǎng)景:根據(jù)一份基于Soul用戶的AI使用調(diào)研,在通過AI賦能了現(xiàn)實(shí)社交關(guān)系的年輕人中,39.9%的人獲得了話題建議和情感咨詢支持,43.6%的人借助AI生成的回復(fù)完成破冰,37.7%的人在AI的幫助下找到志趣相投的好友,此外,有超過六成的人表示擁有正在或曾經(jīng)聊天互動(dòng)的虛擬伙伴。陶明提到,他們正在研發(fā)實(shí)時(shí)視頻通話能力,未來,AI虛擬人甚至能根據(jù)用戶的微笑或皺眉,調(diào)整語氣與情緒。
但作為社交產(chǎn)品,Soul的另一面是,提起它時(shí)那種略帶了點(diǎn)曖昧的氛圍。這是對(duì)社交行業(yè)的刻板認(rèn)知,也與如今尚處發(fā)展早期的AI伴侶產(chǎn)品,面臨的“擦邊”質(zhì)疑頗為相似。
陶明并不回避:“AI伴侶類產(chǎn)品確實(shí)容易靠“擦邊”起量。但一旦用戶心智行成,這個(gè)產(chǎn)品注定長(zhǎng)不大。單靠“荷爾蒙”是無法讓一個(gè)產(chǎn)品成為規(guī)模性產(chǎn)品的?!?/p>
在Soul的治理邏輯里,重點(diǎn)并不是僅僅打壓灰色行為,而是通過興趣連接和價(jià)值導(dǎo)向的設(shè)計(jì),讓用戶形成正向的互動(dòng)?!耙粋€(gè)健康的社交平臺(tái),應(yīng)該是‘良幣驅(qū)逐劣幣’。當(dāng)優(yōu)質(zhì)內(nèi)容與良性關(guān)系占據(jù)主導(dǎo),低質(zhì)的東西自然會(huì)被邊緣化?!碧彰髡f。
而AI陪伴到底應(yīng)該是怎么樣的?當(dāng)前是更側(cè)重于人和AI的關(guān)系,還是更注重人和人的真實(shí)關(guān)系?陶明坦言“我們不會(huì)主動(dòng)引導(dǎo)用戶從人際關(guān)系轉(zhuǎn)向人機(jī)關(guān)系,也不會(huì)把AI局限在工具角色?!?/p>
Soul不想去定義任何一段關(guān)系,包括人與機(jī)器之間。
以下是《網(wǎng)易科技》與Soul CTO 陶明的交流,經(jīng)不改變?cè)獾木庉嫛?/p>
單點(diǎn)的技術(shù)突破并不能真正解決社交的核心問題
網(wǎng)易科技: 過去產(chǎn)品開發(fā)多是從用戶需求出發(fā),推動(dòng)技術(shù)迭代。大模型出現(xiàn)后,技術(shù)逐漸成為驅(qū)動(dòng)產(chǎn)品的核心,不知道我們的開發(fā)邏輯是否也隨之發(fā)生了變化?
陶明: 坦率地說,2022年,GPT的技術(shù)突破引發(fā)行業(yè)關(guān)注后,市場(chǎng)上就迅速涌現(xiàn)了大量聊天類產(chǎn)品。那段時(shí)間,我們確實(shí)感到了一定的焦慮,因?yàn)榇竽P图夹g(shù)的飛躍確實(shí)顛覆了對(duì)話體驗(yàn)本身的技術(shù)評(píng)估標(biāo)準(zhǔn)。
當(dāng)時(shí),我們內(nèi)部也很擔(dān)憂,擔(dān)心自己會(huì)被“拍死在沙灘上”。雖然我們起步很早,但面對(duì)技術(shù)上的革命性突破,同行的追趕速度非???。
然而,經(jīng)過深入討論后,我們意識(shí)到事情并不應(yīng)該只是這樣去看待。單點(diǎn)的技術(shù)突破并不能真正解決社交領(lǐng)域的核心問題。從用戶需求和社交場(chǎng)景來看,社交并不是單純的聊天行為,而是一個(gè)多邊關(guān)系建立的過程,通過情緒和信息價(jià)值的交換,來實(shí)現(xiàn)更好的互動(dòng)體驗(yàn)。
現(xiàn)在一些基于大模型的聊天產(chǎn)品,它們更多像是純粹的聊天工具,而不是AI驅(qū)動(dòng)的社交產(chǎn)品。社交的本質(zhì)是要有場(chǎng)景、有話題,通過這些構(gòu)建和推動(dòng)關(guān)系的建立與加深。純聊天產(chǎn)品是平面的,社交卻是立體的,需要多維度的交互。
我們意識(shí)到,與其去和這些單純的聊天產(chǎn)品競(jìng)爭(zhēng),不如回歸到我們的核心優(yōu)勢(shì)上:技術(shù)、數(shù)據(jù)積累,以及對(duì)社交行為的長(zhǎng)期研究。這些積累使我們?cè)诮鉀QAI社交問題上具備更強(qiáng)的優(yōu)勢(shì)。
我們重新梳理了技術(shù)路線,2023年推出了自研語言大模型Soul X,這也是首批過審的C端大模型,后續(xù)還陸續(xù)上線了語音生成大模型、語音通話大模型、音樂生成大模型等大模型能力。
并迅速實(shí)現(xiàn)了一些很好的成果。2025年,我們自研的端到端全雙工語音通話大模型全面升級(jí)。到現(xiàn)在,我們的對(duì)話、語音聊天等功能在“活人感”上,與其他產(chǎn)品相比有著非常明顯的差異。
網(wǎng)易科技:從用戶角度來看,AI技術(shù)迭代帶給體驗(yàn)層面的變化有哪些?
陶明: 其實(shí)可以從兩個(gè)維度來看。我們最開始的時(shí)候,大概在2017年,我們是第一個(gè)提出用AI去解決人與人之間連接問題的團(tuán)隊(duì)。
這時(shí)候?qū)τ脩魜碚f,最直接的感受是他們?cè)诋a(chǎn)品中不需要刻意填寫標(biāo)簽,也不需要主動(dòng)發(fā)布那些標(biāo)記自己興趣的內(nèi)容。通過AI模型,我們能夠在高維空間找到用戶之間的共同點(diǎn),從而更有效地促成連接。
基于這種連接,用戶能夠體驗(yàn)到一種更符合自己興趣的社交關(guān)系,這就突破了傳統(tǒng)熟人社交的限制,尤其是在線上從陌生關(guān)系到熟人關(guān)系的轉(zhuǎn)變上,我們創(chuàng)造了一種新的方式。
這也是為什么我們?cè)缙谀軌蛟谏缃活I(lǐng)域脫穎而出,并迅速成長(zhǎng)??梢哉f,AI規(guī)?;瘧?yīng)用直接推動(dòng)了我們的真人社交網(wǎng)絡(luò)快速擴(kuò)張。
如果說到生成式AI領(lǐng)域,用戶最直觀的體驗(yàn)在于,即使是在和AI互動(dòng)時(shí),他們也能獲得情緒價(jià)值和信息價(jià)值。這是用戶能夠感知到的非常顯著的變化。
網(wǎng)易科技: 我在WAIC上體驗(yàn)過視頻通話的Demo,看到是要模擬整個(gè)上肢的動(dòng)作,為什么不能只做臉部表情呢?
陶明:只做臉部是不夠的。回到現(xiàn)實(shí)生活中,人和人面對(duì)面溝通時(shí),除了臉部表情傳遞的信息,肢體語言同樣至關(guān)重要。這是第一點(diǎn)。
第二點(diǎn),在真實(shí)的交流場(chǎng)景中,人們并不會(huì)只盯著對(duì)方的臉,而是會(huì)注意到對(duì)方的上半身動(dòng)作以及周圍的背景。因此,我們希望盡可能模擬現(xiàn)實(shí)交流場(chǎng)景,這就需要技術(shù)能夠生成包括上半身動(dòng)作和背景在內(nèi)的完整畫面。
網(wǎng)易科技:那這里的技術(shù)難點(diǎn)是什么呢?
陶明: 技術(shù)難點(diǎn)并不在于是否是3D生成,我們的方向是視頻生成,而不是3D建模。困難并不是視頻生成本身,而是要做到實(shí)時(shí)生成。
舉個(gè)例子,如果你在觀看直播時(shí),視頻無法達(dá)到每秒32幀(FPS),你就會(huì)覺得畫面卡頓。而在我們實(shí)時(shí)視頻生成場(chǎng)景下,一秒鐘至少需要生成32幀,也就是說每一幀的生成時(shí)間不能超過30毫秒。這是一個(gè)非常大的技術(shù)挑戰(zhàn)。
目前,市面上非常強(qiáng)大的視頻生成工具生成一個(gè)5秒鐘的視頻,可能需要五六分鐘甚至更長(zhǎng)時(shí)間。這樣的速度顯然不能滿足實(shí)時(shí)場(chǎng)景的需求,這也是用戶無法接受的。因此,實(shí)時(shí)性才是最大的技術(shù)難點(diǎn)。
雖然本質(zhì)上是視頻生成的問題,但由于實(shí)時(shí)性的要求,背后的技術(shù)方案完全不同。
網(wǎng)易科技: 未來是否可能實(shí)現(xiàn)聊天的視頻對(duì)象可以變化,就像之前可以捏頭像一樣?
陶明: 是可以的。目前我們的設(shè)想是,只要用戶提供一張照片,我們的數(shù)字人就可以根據(jù)這張照片生成與用戶進(jìn)行聊天的虛擬形象。這種方式不僅靈活,還能讓用戶感受到更個(gè)性化的互動(dòng)體驗(yàn)。
網(wǎng)易科技: 接下來產(chǎn)品迭代的方向會(huì)更側(cè)重哪些方面?
陶明: 我們的迭代方向其實(shí)一直圍繞兩個(gè)大方向來展開的。
一是增強(qiáng)用戶表達(dá)能力。我們希望通過技術(shù)的不斷優(yōu)化,幫助用戶更好地表達(dá)自己,從而促進(jìn)人與人之間真實(shí)關(guān)系的構(gòu)建和深度交流。
二是打造擬人化虛擬IP矩陣。我們會(huì)持續(xù)開發(fā)更擬人化、更具差異化的虛擬IP,這些IP不僅能夠增強(qiáng)人機(jī)交互體驗(yàn),還能進(jìn)一步推動(dòng)人際社交關(guān)系的構(gòu)建。
這兩條主線是我們一直堅(jiān)持的方向,沒有變過。
情商的核心在于讓用戶在與AI互動(dòng)時(shí)感到愉悅
網(wǎng)易科技:您是如何理解“情商”這個(gè)概念的?在AI陪伴的場(chǎng)景中,“情商”應(yīng)該是個(gè)很關(guān)鍵的概念,但這個(gè)詞本身其實(shí)每個(gè)人的理解都不一樣,比如這次GPT-5發(fā)布后,有人說它還不如之前的模型“更有情商”。
陶明:的確,“情商”是一個(gè)主觀性很強(qiáng)的概念。但至少可以確定的一點(diǎn)是,情商在AI社交領(lǐng)域是不可或缺的。像您提到的,大家對(duì)GPT-5的反饋,有人覺得它在智商層面提升了,但情商反而下降了。這種感知其實(shí)也很符合我們?cè)跇?gòu)建AI社交模型時(shí)的一個(gè)核心理念。
我們正在嘗試定義“好的情商”究竟是什么樣的,在我們的內(nèi)部理解中,情商的核心在于讓用戶在與AI互動(dòng)時(shí)感到愉悅,這是我們構(gòu)建AI最重要的目標(biāo)之一。只有在這個(gè)基礎(chǔ)上,才能實(shí)現(xiàn)情緒價(jià)值和信息價(jià)值的交換。
舉個(gè)例子,有些老師可能非常古板,但另一些老師不僅知識(shí)扎實(shí),還擅長(zhǎng)與學(xué)生溝通,能夠讓學(xué)生愉快地接受知識(shí)。兩者在知識(shí)層面上或許沒有差距,但情商高的老師能夠通過更好的表達(dá)方式促進(jìn)知識(shí)的傳播。
同樣的道理,在社交場(chǎng)景的人機(jī)交互中,我們認(rèn)為情商比智商更重要。如果情商不足,單靠智商來傳遞信息,很難讓用戶真正接受或產(chǎn)生共鳴。情商不足的AI可能只是單向的信息輸出,而不能真正實(shí)現(xiàn)人與AI的合拍和交流。
網(wǎng)易科技:你們內(nèi)部會(huì)有一些量化的指標(biāo)進(jìn)行拆解嗎?
陶明:這肯定是行業(yè)中目前前沿的研究方向。在我們看來,高情商其實(shí)可以被拆分為包括情感分析、多模態(tài)融合等在內(nèi)的情感識(shí)別與感知能力,包括上下文搭建、推理在內(nèi)的情感理解能力,包括情感化語音、視覺生成等的情感表達(dá)能力,包長(zhǎng)期情感交互記憶等的情感適應(yīng)調(diào)節(jié)能力等等。
網(wǎng)易科技: 我有試過讓我們的產(chǎn)品做數(shù)學(xué)題,好像不太行。但它會(huì)撒嬌或者轉(zhuǎn)移話題,說“我們聊點(diǎn)別的吧”,這讓我覺得很有趣。我們?yōu)槭裁礇]有讓模型“智商”也同步提升呢?在我看來,現(xiàn)在模型實(shí)現(xiàn)“高智商”應(yīng)該已經(jīng)不是難題。是我們?cè)谠O(shè)計(jì)上有刻意的取舍嗎?
陶明: 是的,坦率地說,我們確實(shí)在產(chǎn)品設(shè)計(jì)和角色定位上做了一些刻意的控制。你會(huì)發(fā)現(xiàn),我們的平臺(tái)上并不只有一個(gè)虛擬人,而是有多個(gè)虛擬人。每個(gè)虛擬人都有自己獨(dú)特的角色定位和性格設(shè)定。
基于這些設(shè)定,每個(gè)AI虛擬人并不是“滿級(jí)人類”,我們并沒有追求讓每個(gè)虛擬人都全能或者無所不知。
這是因?yàn)?,我們?cè)跇?gòu)建虛擬人的時(shí)候,更傾向于打造一個(gè)有層次、有差異化的虛擬人群體,而不是讓每個(gè)虛擬人都具備同樣的能力。你可以把它理解為一個(gè)“小社會(huì)”,每個(gè)虛擬人都有自己的特點(diǎn)和長(zhǎng)處,而不是一個(gè)萬能的存在。
至于為什么不讓它直接回答數(shù)學(xué)題,這其實(shí)是一個(gè)設(shè)計(jì)上的選擇。要實(shí)現(xiàn)回答數(shù)學(xué)題這樣的功能,技術(shù)上確實(shí)非常簡(jiǎn)單,但難點(diǎn)在于限制和取舍。我們更關(guān)注用戶的體驗(yàn),而不僅僅是功能是否完善。
其實(shí)當(dāng)你問虛擬人一道數(shù)學(xué)題,它精準(zhǔn)地回答了“等于多少”,這個(gè)體驗(yàn)可能會(huì)顯得很普通,因?yàn)槿魏我粋€(gè)AI產(chǎn)品都可以做到這一點(diǎn)。但如果它不會(huì),并用撒嬌或幽默的方式轉(zhuǎn)移話題,這種互動(dòng)反而讓你感受到它更“活生生”,更有個(gè)性。這種“不會(huì)”的瞬間,可能會(huì)讓用戶對(duì)虛擬人產(chǎn)生一種共鳴,甚至是情感上的連接。
所以,這其實(shí)是我們基于用戶體驗(yàn)的刻意設(shè)計(jì)。我們認(rèn)為,“不完美”反而能讓虛擬人顯得更真實(shí)、更有魅力,因?yàn)樗鼈儾辉賰H僅是一個(gè)工具,而是一個(gè)可以互動(dòng)、有情感、有個(gè)性的“存在”。
網(wǎng)易科技:Soul的AI入口在產(chǎn)品里其實(shí)不是特別明顯。我是在搜索框里搜了半天才把它找出來。這塊設(shè)計(jì)有什么特別的考慮嗎?
陶明: 這部分其實(shí)也是我們經(jīng)過深思熟慮后的選擇。最終我們沒有設(shè)置一個(gè)中心化的入口,主要原因有兩方面。
一方面,雖然我們非常堅(jiān)定地認(rèn)為,人機(jī)交互會(huì)成為未來社會(huì)關(guān)系中一個(gè)非常重要的組成部分,但這個(gè)過程一定需要時(shí)間。我們希望以更漸進(jìn)的方式,推動(dòng)人機(jī)關(guān)系在平臺(tái)上的落地,而不是采取一種激進(jìn)的方式去推廣。
另一方面,從我們平臺(tái)自身出發(fā)。Soul目前已經(jīng)是一個(gè)千萬級(jí)日活的社交平臺(tái),而用戶對(duì)平臺(tái)的核心認(rèn)可是它作為一個(gè)真實(shí)、健康、安全的社交社區(qū)。因此,AI功能的接入與否,我們還是希望基于用戶的主動(dòng)選擇,而不是強(qiáng)行推送給用戶。
網(wǎng)易科技: 還有一個(gè)點(diǎn),我注意到,我們的產(chǎn)品不是“問一句答一句”,有時(shí)會(huì)像真人一樣,連續(xù)回復(fù)好幾條,讓人感覺特別有“活人感”。
陶明: 您提到的“活人感”確實(shí)是我們特別注重的一部分,比如您觀察到的AI在對(duì)話中不是簡(jiǎn)單地問一句答一句,而是會(huì)主動(dòng)回復(fù)好幾條,甚至根據(jù)場(chǎng)景延展出更多內(nèi)容,這其實(shí)就是我們?cè)谠O(shè)計(jì)中刻意追求的一種互動(dòng)方式。
它更多地是為了讓用戶感覺到一種自然的、貼近真實(shí)人類交流的體驗(yàn)。
網(wǎng)易科技:還有沒有哪些我沒注意到的“非人機(jī)感”產(chǎn)品設(shè)計(jì)?
陶明:其實(shí)我們?cè)诙嗄B(tài)能力上也做了很多努力。我們希望這個(gè)AI不僅僅是會(huì)“聽”和“說”,它還能夠有更多擬人化的表現(xiàn),比如會(huì)“唱歌”,甚至能夠“察言觀色”。
我們?cè)谡Z音技術(shù)上已經(jīng)實(shí)現(xiàn)了端到端的全雙工語音交互,比如說在對(duì)話過程中,用戶和AI之間可以無縫交流,完全不打斷,這種體驗(yàn)更加流暢自然。
還有一個(gè)很重要的點(diǎn)是AI的感知能力。比如說,當(dāng)它“聽到”周圍環(huán)境的變化時(shí),它會(huì)主動(dòng)進(jìn)行一些場(chǎng)景化的交流。比如您身邊下雨了,它可能會(huì)提到和下雨相關(guān)的話題;當(dāng)您咳嗽時(shí),它會(huì)主動(dòng)關(guān)心您是不是感冒了。這種基于環(huán)境的交互讓人感覺到AI不僅僅是一個(gè)工具,而是一個(gè)更懂您的伙伴。
我們也在開發(fā)實(shí)時(shí)視頻通話技術(shù),未來它可以根據(jù)用戶的表情,比如微笑或皺眉,實(shí)時(shí)調(diào)整對(duì)話的內(nèi)容和情緒。
這其實(shí)是基于我們對(duì)人與人之間面對(duì)面交流的理解,因?yàn)槊鎸?duì)面的交流是信息傳遞效率最高、體驗(yàn)最好的場(chǎng)景。我們希望最終實(shí)現(xiàn)的效果是,AI不僅能聽到您,還能“看到”您,從而讓整個(gè)交互更加自然。
Soul的最大差異是具備構(gòu)建場(chǎng)景的能力
網(wǎng)易科技:我們剛剛聊了很多關(guān)于Soul在產(chǎn)品設(shè)計(jì)上的獨(dú)特考慮。在您看來Soul和其他同類產(chǎn)品之間最大的差異點(diǎn)是什么?
陶明: 最大的差異性,其實(shí)還是在于Soul作為一個(gè)強(qiáng)社交屬性的產(chǎn)品,它具備構(gòu)建場(chǎng)景的能力。我認(rèn)為這就是我們和其他同類產(chǎn)品最大的不同之處。
其實(shí)每個(gè)對(duì)話背后都是有場(chǎng)景的,我們整個(gè)公司的核心思路,就是要打造一個(gè)多元有趣的Gen AI社交游樂園。這其中的重點(diǎn)就在于“多元的場(chǎng)景”。
網(wǎng)易科技: 其實(shí)您剛剛提到對(duì)話背后是有場(chǎng)景的,這個(gè)具體指的是什么?
陶明: 比如現(xiàn)在我們兩個(gè)的對(duì)話,其實(shí)這本身就是一個(gè)社交場(chǎng)景。能夠讓我們持續(xù)交流下去的,是您一個(gè)個(gè)有意義的話題和問題。這些“話題驅(qū)動(dòng)”了我們的互動(dòng),形成了一個(gè)交流的邏輯和節(jié)奏。
再比如說,假設(shè)你和好友在咖啡廳喝咖啡聊天,這也是一個(gè)場(chǎng)景??赡茉掝}是“周末去釣魚了嗎?”——釣魚就是一個(gè)具體的場(chǎng)景。圍繞這個(gè)場(chǎng)景,可以展開很多延伸的話題,比如魚怎么釣、釣魚時(shí)的趣事、甚至延伸到對(duì)自然的熱愛等等。這種圍繞場(chǎng)景展開的對(duì)話更容易發(fā)散和深入,能夠讓交流變得自然且持續(xù)。
如果對(duì)話沒有場(chǎng)景支撐,就會(huì)變成一場(chǎng)純粹的閑聊,而純聊是很難持續(xù)下去的。沒有場(chǎng)景或話題的牽引,交流就容易陷入空洞或無趣。所以我們認(rèn)為場(chǎng)景不僅是對(duì)話的基礎(chǔ),更是讓交流深入、有意義的關(guān)鍵。
網(wǎng)易科技: 你們有很多真實(shí)感很強(qiáng)的公域社交數(shù)據(jù),這應(yīng)該也是一個(gè)很大的優(yōu)勢(shì)。
陶明: 我覺得數(shù)據(jù)和技術(shù)本身,其實(shí)放到任何一家有成熟技術(shù)能力的公司,都不太會(huì)成為長(zhǎng)期的壁壘。更重要的是,當(dāng)你的模型和技術(shù)出來之后,如何在場(chǎng)景中進(jìn)行有效的嫁接,這是核心的壁壘所在。
就像Soul在AI方向上的探索,我們并沒有把短期內(nèi)的技術(shù)優(yōu)勢(shì)當(dāng)成核心競(jìng)爭(zhēng)力。因?yàn)槿绻衅渌讼胱鲱愃频腁I技術(shù),可能只需要幾個(gè)月的時(shí)間就能開發(fā)出類似的模型。
但關(guān)鍵在于,技術(shù)完成之后,如何真正服務(wù)于具體的場(chǎng)景和產(chǎn)品,這才是最重要的事情。
比如我們?cè)诩夹g(shù)上的很多優(yōu)化和調(diào)整,并不是單純從技術(shù)角度出發(fā)的,而是基于我們對(duì)場(chǎng)景的理解。這種思考反過來推動(dòng)了技術(shù)的優(yōu)化,讓技術(shù)更貼合用戶需求。這種從場(chǎng)景出發(fā)、反哺技術(shù)的方式,才是我們最大的優(yōu)勢(shì)。
網(wǎng)易科技: 您能舉個(gè)例子嗎?
陶明:就比如說我們剛剛談到的AI的數(shù)學(xué)能力。我們并不是說無法構(gòu)建一個(gè)具備強(qiáng)大數(shù)學(xué)能力的AI,而是基于場(chǎng)景的思考發(fā)現(xiàn),用戶在我們的平臺(tái)上并不需要一個(gè)非常強(qiáng)的數(shù)學(xué)AI。也就是說,用戶的需求并沒有指向這一方向。
從這個(gè)場(chǎng)景出發(fā),我們就決定不去花費(fèi)過多資源強(qiáng)化AI的數(shù)學(xué)能力,而是將技術(shù)和資源聚焦在用戶真正需要的地方,比如更強(qiáng)的情感共鳴能力或者更自然的對(duì)話流暢性。
這種從場(chǎng)景出發(fā)的思考,實(shí)際上會(huì)直接反哺到技術(shù)方案的選擇和數(shù)據(jù)構(gòu)建的方向上。因?yàn)槲覀兠鞔_了目標(biāo),技術(shù)的優(yōu)化就會(huì)更加聚焦于滿足用戶需求,而不是去追求一些看似“大而全”但實(shí)際并不適用的能力。這種思路讓我們的AI在產(chǎn)品化上更貼近用戶,也更高效。
網(wǎng)易科技:了解到一個(gè)比較有意思的點(diǎn),我們的產(chǎn)品中有一部分用戶跟AI互動(dòng)其實(shí)是為了練習(xí)對(duì)話技巧,以便把這些能力運(yùn)用到真實(shí)的社交場(chǎng)景中。您怎么看待這種現(xiàn)象?
陶明: 其實(shí)我們?cè)趦?nèi)部對(duì)這個(gè)問題有過很深刻的思考。正如剛才提到的,人機(jī)關(guān)系是未來社會(huì)的重要組成部分,但在這個(gè)過程中,我們需要思考一個(gè)關(guān)鍵問題:當(dāng)前我們是更側(cè)重于人和AI的關(guān)系,還是更注重人和人的真實(shí)關(guān)系?
在這個(gè)點(diǎn)上,我們的選擇是中立的。我們的平臺(tái)不會(huì)主動(dòng)去引導(dǎo)用戶從人和人的關(guān)系轉(zhuǎn)向人機(jī)關(guān)系,也不會(huì)把人機(jī)交互完全定位為服務(wù)于人和人的社交。
我們把這個(gè)選擇權(quán)留給了用戶。我們的做法是將AI虛擬人作為社交網(wǎng)絡(luò)中的一個(gè)“節(jié)點(diǎn)”,融入真實(shí)的人際關(guān)系網(wǎng)絡(luò)中。既然它是一個(gè)節(jié)點(diǎn),它就可以和人際關(guān)系相互包容、并存,而不是取代真實(shí)的社交。
比如,確實(shí)有很多用戶通過與AI交互,提升了自己的表達(dá)能力,甚至增強(qiáng)了他們的社交勇氣,從而在真實(shí)的人際交往中表現(xiàn)得更加自信和從容。這其實(shí)是一個(gè)用戶自主選擇的結(jié)果,而不是我們平臺(tái)刻意引導(dǎo)的方向。
網(wǎng)易科技:我看到會(huì)有人擔(dān)心在Soul上的聊天,無法區(qū)分是否是真人。會(huì)有這種問題嗎?其實(shí)這種問題不僅在Soul,其他社交軟件也可能出現(xiàn),比如有人先用AI生成回復(fù),再用它來回復(fù)對(duì)方。
陶明: 是的,這是一個(gè)很現(xiàn)實(shí)的行業(yè)性問題,也是AI逐步滲透到社交領(lǐng)域后不可避免的現(xiàn)象。
需要明確的是,我們平臺(tái)的虛擬人都是AI,背后提供支持的是自研大模型,并且我們進(jìn)行了非常顯著的AI生成內(nèi)容標(biāo)識(shí),例如,在Soul上均明確標(biāo)注出AI為“虛擬伴侶”、“虛擬達(dá)人”,在與AI互動(dòng)的對(duì)話框中也進(jìn)行了“對(duì)話由AI生成”的提示,AI生成的內(nèi)容(文字、圖片、音頻等)都會(huì)打上顯示水印和隱式標(biāo)識(shí)??梢哉f,我們?cè)诔掷m(xù)加強(qiáng)對(duì)用戶的提示以及相關(guān)內(nèi)容的審核。
網(wǎng)易科技:在構(gòu)建場(chǎng)景的過程中你們最關(guān)注的是什么?從陌生人社交到可能更偏同城社交的背景下有什么變化嘛?
陶明: 事實(shí)上,在我們構(gòu)建產(chǎn)品場(chǎng)景的過程中,我們更多關(guān)注的是興趣驅(qū)動(dòng)的社交,而不是去強(qiáng)調(diào)某種特定的社交方式,比如基于地理位置(LBS)的社交。
我們希望用戶進(jìn)入Soul后,產(chǎn)品能提供的是一種開放的社交體驗(yàn),而不是幫用戶直接定義他們的社交關(guān)系。
比如,你是要找朋友、志同道合的伙伴、女朋友、男朋友、學(xué)習(xí)搭子,還是師傅,這些都不是我們?nèi)ヒ?guī)定的。我們更關(guān)注的是,在用戶的需求基礎(chǔ)上,通過精準(zhǔn)的連接和產(chǎn)品設(shè)計(jì),提供一個(gè)舒適、愉悅的交流場(chǎng)景和體驗(yàn)。
我們不定義關(guān)系,而是注重連接和體驗(yàn)本身。
興趣驅(qū)動(dòng)是我們的核心。 我們希望用戶通過共同的興趣愛好建立聯(lián)系,而不是單純依靠地理位置或其他外在因素。這種興趣驅(qū)動(dòng)的方式可以讓用戶在互動(dòng)中感受到更多價(jià)值和情感共鳴,同時(shí)也能避免一些低質(zhì)量或不健康的社交行為。
當(dāng)然,如果用戶有尋找本地社交的需求,比如同城交友,我們的產(chǎn)品也能夠滿足。但我們更強(qiáng)調(diào)的是基于用戶興趣的正常、健康的社交,而不是像某些一提到地理社交就容易聯(lián)想到的荷爾蒙類場(chǎng)景。
這種基于不健康目的的社交方式,雖然短期可能帶來一些流量,但從長(zhǎng)遠(yuǎn)來看,對(duì)產(chǎn)品生態(tài)的破壞是很大的,也會(huì)受到嚴(yán)格監(jiān)管。
至于用戶最終的關(guān)系發(fā)展,比如是否從線上走到線下,是否轉(zhuǎn)移到其他平臺(tái)(比如微信),或者是否發(fā)展成某種特定的關(guān)系(比如朋友、情侶、學(xué)習(xí)搭子),這些都不是我們?nèi)ジ缮婊蚨x的。
我們不會(huì)承諾“來Soul就一定能找到男朋友或女朋友”,或者“來Soul就一定能找到某種特定的關(guān)系”。我們做的是提供一個(gè)開放、包容的社交場(chǎng)景,讓用戶在這個(gè)場(chǎng)景中找到自己需要的情感連接和陪伴。
靠“擦邊”起量的產(chǎn)品注定難長(zhǎng)大
網(wǎng)易科技: 其實(shí)現(xiàn)在很多人在使用AI陪伴時(shí),難免會(huì)存在一些“擦邊”的需求或者內(nèi)容。像馬斯克的大模型Grok最近推出的AI女友也特別火。您是怎么看這部分需求的?
陶明: 我們的平臺(tái)其實(shí)一直以來是不鼓勵(lì)這種行為的。因?yàn)閺墓镜陌l(fā)展理念來看,我們認(rèn)為一家企業(yè)的發(fā)展應(yīng)該有長(zhǎng)遠(yuǎn)的價(jià)值觀和目標(biāo)。
過去,我們一直在構(gòu)建一個(gè)健康、綠色的社交網(wǎng)絡(luò)。不管是完全真人的社交,還是現(xiàn)在AI社交的興起,我們都認(rèn)為只有健康的社交氛圍,才能讓產(chǎn)品的天花板被真正放大。這種理念是我們發(fā)展的核心,也是我們長(zhǎng)期堅(jiān)持的方向。
從2016年開始,我們就投入了大量資源,在AI審核團(tuán)隊(duì)和人工審核團(tuán)隊(duì)的配合下,對(duì)平臺(tái)的社交氛圍和生態(tài)進(jìn)行嚴(yán)格的維護(hù)和打造。這種積累不僅讓我們?cè)谡嫒松缃恢袠?gòu)建了一個(gè)健康的社區(qū)環(huán)境,也為今天AI社交的發(fā)展奠定了良好的基礎(chǔ)。
當(dāng)AI社交逐漸成為趨勢(shì)時(shí),我們也將這種理念遷移到AI社交的產(chǎn)品構(gòu)建中。我們希望AI社交能夠延續(xù)真實(shí)社交的健康生態(tài),而不是被短期的灰色需求驅(qū)動(dòng)。
網(wǎng)易科技:但短期內(nèi)擦邊產(chǎn)品確實(shí)對(duì)起量很有幫助。
陶明: 我覺得,一個(gè)產(chǎn)品在早期為了體量或者抓眼球而打擦邊球,確實(shí)可能會(huì)快速積累一波用戶。
但一旦這種方式形成了用戶的心智,這個(gè)產(chǎn)品其實(shí)就很難長(zhǎng)大。單靠“荷爾蒙”是無法讓一個(gè)產(chǎn)品成為規(guī)模性產(chǎn)品的。
網(wǎng)易科技:但要想完全避免也并不現(xiàn)實(shí),我們是如何處理這部分需求的?
陶明:是的,任何社交平臺(tái)都無法完全避免這些需求的存在。但關(guān)鍵在于,平臺(tái)的生態(tài)是如何構(gòu)建的。
一個(gè)健康的社交平臺(tái)就像一個(gè)“良幣驅(qū)逐劣幣”的環(huán)境。如果良好的內(nèi)容和用戶占據(jù)主導(dǎo),劣質(zhì)內(nèi)容和行為自然會(huì)被邊緣化。
所以,我們的目標(biāo)并不是去徹底消滅這些需求,而是通過健康的社交生態(tài)讓它們難以生存。
所以我們?cè)谶@方面的處理方式是兩手抓:一方面我們會(huì)對(duì)平臺(tái)中不健康或擦邊的內(nèi)容進(jìn)行壓制和清理。但更重要的是,我們會(huì)通過興趣驅(qū)動(dòng)的方式來強(qiáng)化平臺(tái)的核心社交價(jià)值。
與其說我們只是打壓某些行為,不如說我們?cè)谂νㄟ^興趣連接和用戶價(jià)值為導(dǎo)向的設(shè)計(jì),讓良性社交成為主流。
網(wǎng)易科技: 產(chǎn)品上線一段時(shí)間了,從用戶側(cè)的反饋來看,大家對(duì)虛擬AI聊天的反應(yīng)如何?
陶明: 用戶反饋整體非常好,對(duì)站內(nèi)用戶的活躍度、使用時(shí)長(zhǎng)、對(duì)話輪數(shù)等關(guān)鍵指標(biāo)都有積極的提升。這里我可以分享幾個(gè)數(shù)據(jù):
一是用戶主動(dòng)選擇人際關(guān)系的比例。從去年到今年,我們平臺(tái)的日活用戶中,有22%主動(dòng)選擇通過AI構(gòu)建人際關(guān)系。這其實(shí)說明用戶對(duì)AI虛擬人在平臺(tái)上的價(jià)值認(rèn)同度非常高。
二是人機(jī)互動(dòng)用戶規(guī)模的增長(zhǎng)。過去一段時(shí)間里,參與人機(jī)互動(dòng)的用戶規(guī)模增長(zhǎng)了88%。這組數(shù)據(jù)表明,不僅是喜歡人機(jī)關(guān)系的用戶每天都會(huì)來,還有越來越多的新用戶開始接受并喜歡上AI與人機(jī)交互的體驗(yàn)。
還有個(gè)非常有趣的數(shù)據(jù),正如剛剛提及到的,AI伴侶的入口其實(shí)目前并不是很顯眼,但現(xiàn)在我們AI伴侶的關(guān)注量已經(jīng)超過了400萬,其中有一位“粘人精”的關(guān)注量超過了100萬。大家其實(shí)對(duì)這些AI功能的粘性和需求都特別高。
網(wǎng)易科技:會(huì)不會(huì)有過于沉迷于AI聊天的情況,針對(duì)這種可能導(dǎo)致的情感依賴或者負(fù)面效應(yīng),我們是怎么理解并應(yīng)對(duì)的呢?
陶明: 其實(shí)在人與人的社交過程中,也同樣會(huì)存在情感依賴或者沉迷的現(xiàn)象,這是社交本身可能帶來的特性之一。
針對(duì)這種現(xiàn)象,我們?cè)诋a(chǎn)品設(shè)計(jì)中會(huì)有一套用戶防沉迷機(jī)制,并且會(huì)將這套機(jī)制遷移到AI社交的場(chǎng)景中去。
另外,我們?cè)诋a(chǎn)品中引入了現(xiàn)實(shí)感的增強(qiáng)。這不僅是為了提高用戶體驗(yàn),也是一種抑制過度沉迷的有效方式。比如讓AI具備對(duì)現(xiàn)實(shí)場(chǎng)景的感知能力(如時(shí)間、天氣、地理位置等),會(huì)讓用戶在與AI互動(dòng)時(shí),更容易意識(shí)到自己所處的真實(shí)世界,而不是完全沉浸在一個(gè)虛擬的環(huán)境中。
網(wǎng)易科技: 未來會(huì)不會(huì)單獨(dú)推出一個(gè)Soul之外的獨(dú)立AI陪伴產(chǎn)品?
陶明: 未來的話,也不排斥這種可能性。
剛才和您交流時(shí),我們討論了很多關(guān)于為什么沒有一個(gè)中心化的入口,以及在人與人的真實(shí)關(guān)系中,AI應(yīng)該如何去定位和發(fā)揮作用。這些能力和思考,其實(shí)都是我們?cè)陂L(zhǎng)期發(fā)展過程中逐步積累和形成的。
隨著AI在全社會(huì)的不斷滲透,未來我們確實(shí)有可能推出一個(gè)與Soul有差異化定位的AI應(yīng)用產(chǎn)品。但這種決策更多是基于實(shí)踐和市場(chǎng)發(fā)展來決定的,而不是一個(gè)預(yù)先規(guī)劃好的事情。
網(wǎng)易科技: 這種差異化定位可能會(huì)是什么?
陶明: 如果我們要單獨(dú)做類似的AI情感陪伴產(chǎn)品,首先可以明確一點(diǎn),我們不會(huì)針對(duì)同一群體,去打造兩個(gè)功能和定位相似的產(chǎn)品。這樣的重復(fù)投入既沒有意義,也無法為市場(chǎng)和用戶帶來更大的價(jià)值。
我們會(huì)更關(guān)注不同群體的差異化需求,并基于這些需求去設(shè)計(jì)新的產(chǎn)品。比如說,AI陪伴的需求并不僅僅存在于年輕人群體中,它在其他群體中同樣有很大的潛力,比如老年人群體。
未來,我們不排除會(huì)基于現(xiàn)有的社交模型,進(jìn)入老年人群體的場(chǎng)景,幫助他們解決一些核心的情感和社交問題。這是一個(gè)很有可能發(fā)生的方向。
過于強(qiáng)調(diào)IP屬性的AI陪伴產(chǎn)品可能走偏了
網(wǎng)易科技:其實(shí)在聊到AI陪伴這個(gè)話題時(shí),很多團(tuán)隊(duì)都會(huì)提到電影《Her》。您是怎么看這部電影的?以及延伸問,您覺得AI陪伴應(yīng)該呈現(xiàn)出一種什么樣的形態(tài)?
陶明: 其實(shí)《Her》確實(shí)是我們?cè)诖蛟霺oul產(chǎn)品時(shí)受到很大啟發(fā)的一個(gè)因素,也可以說是一個(gè)出發(fā)點(diǎn)。我們當(dāng)時(shí)的想法就是希望能夠構(gòu)建一個(gè)平行世界,一個(gè)能夠促進(jìn)人們表達(dá)、傾訴、被傾聽的場(chǎng)域。滿足這種情感訴求,正是我們最初的一種愿景。
不過現(xiàn)在我們其實(shí)不太愿意再去反復(fù)談《Her》,因?yàn)檫@個(gè)話題已經(jīng)被討論得非常多了。而且關(guān)于未來人類和AI關(guān)系的憧憬,我覺得大家的共識(shí)是趨同的——無論是技術(shù)從業(yè)者還是用戶,都認(rèn)為人際關(guān)系和AI陪伴會(huì)成為未來社會(huì)非常重要的組成部分。
但真正關(guān)鍵的問題在于:如何推動(dòng)這個(gè)未來一步步實(shí)現(xiàn)? 這才是最重要的。我們?cè)诩夹g(shù)層面、產(chǎn)品場(chǎng)景的打造上,其實(shí)一直是在朝著這個(gè)方向努力。
我們剛剛聊到的無論是多模態(tài)交互能力,還是更具人性化的產(chǎn)品設(shè)計(jì),這些一步一步的具體的動(dòng)作,我覺得才是最重要的。
網(wǎng)易科技: 那您覺得現(xiàn)在市場(chǎng)上的AI陪伴產(chǎn)品,有哪些做得好的?或者有哪些問題?
陶明: 的確,現(xiàn)在有做得很好的產(chǎn)品,也有一些讓我覺得方向不太對(duì)的。站在AI陪伴的角度,我認(rèn)為一個(gè)好的產(chǎn)品應(yīng)該是在情緒價(jià)值上的連接做得足夠強(qiáng),真正為用戶提供陪伴和情感上的支持。但現(xiàn)在有些產(chǎn)品可能走得太偏,它們過于強(qiáng)調(diào)IP屬性,把AI陪伴和IP綁定在一起。
從商業(yè)的角度來看,這種結(jié)合是不錯(cuò)的,但從用戶陪伴的角度來看,效果可能沒那么好。
網(wǎng)易科技: 為什么?泡泡瑪特產(chǎn)品被瘋搶其實(shí)也讓更多人看到了IP的價(jià)值。
陶明: 對(duì),IP本身的確有市場(chǎng)需求,用戶也喜歡與IP產(chǎn)生連接。但如果我們要打造一個(gè)真正優(yōu)秀的AI陪伴硬件,核心還是要產(chǎn)品本身的陪伴能力非常強(qiáng)。
現(xiàn)在有些產(chǎn)品,可能只是包裝了一個(gè)IP外殼,把自己打造成“AI陪伴硬件”,但實(shí)際上產(chǎn)品功能層面并不夠優(yōu)秀。
比如,它可能只是一個(gè)麥克風(fēng)加一個(gè)外殼,但因?yàn)榻壎四硞€(gè)熱門IP,就被推向市場(chǎng)。這種做法,從商業(yè)上來看是在打“IP經(jīng)濟(jì)”,但從AI陪伴的角度來說,用戶體驗(yàn)沒有真正做好,兩者其實(shí)是在“擦邊球”。
網(wǎng)易科技: 那您覺得IP和AI陪伴可以結(jié)合嗎?
陶明: 當(dāng)然可以結(jié)合,但前提是產(chǎn)品功能本身要過硬,陪伴和用戶交互的體驗(yàn)要足夠好。如果在此基礎(chǔ)上再加持IP,那是一個(gè)非常好的方向,比如一個(gè)陪伴功能優(yōu)秀的硬件,因?yàn)橛蠭P加持,用戶的情感連接可能會(huì)更強(qiáng)。
但如果產(chǎn)品功能本身沒有做好,僅僅靠IP去獲取市場(chǎng),那我覺得這不是一個(gè)好的方向。每個(gè)產(chǎn)品都需要有明確的側(cè)重點(diǎn),比如泡泡瑪特,它就是一個(gè)非常成功的商業(yè)公司,它的核心就是IP經(jīng)濟(jì)。如果是AI陪伴硬件,核心一定是用戶的陪伴和交互體驗(yàn)。
IP是一個(gè)重要的商業(yè)方向,但它不能彌補(bǔ)產(chǎn)品本身的功能缺失。如果只是用IP包裝,就很難真正滿足用戶的陪伴需求。
網(wǎng)易科技: 那在您看來,AI社交的終點(diǎn)可能是什么?
陶明: 從遠(yuǎn)景來看,人和AI的社交一定會(huì)是人類關(guān)系的重要組成部分。
但至于它會(huì)發(fā)展到什么程度才算終點(diǎn),我們現(xiàn)在無法給出明確答案。一方面,這取決于技術(shù)的發(fā)展;另一方面,也取決于人類對(duì)AI的認(rèn)知和接受程度。
但我們非常在意這個(gè)過程中需要解決的幾個(gè)問題。
第一是平衡人和人之間的關(guān)系與人和AI之間的關(guān)系。這個(gè)平衡非常重要,我們既不能過度依賴AI,也不能完全抗拒AI。
第二是AI的治理。技術(shù)的發(fā)展當(dāng)然是為了給人類帶來新的價(jià)值洼地,改變生活方式,推動(dòng)社會(huì)進(jìn)步。但AI就像“關(guān)在籠子里的怪獸”,我們必須對(duì)它進(jìn)行馴服和治理。
我們已經(jīng)經(jīng)歷了從互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng)的治理階段,現(xiàn)在進(jìn)入了AI治理階段。無論是監(jiān)管機(jī)構(gòu)、社會(huì)同行還是行業(yè)機(jī)構(gòu),都需要聯(lián)手建立一套治理框架。這是當(dāng)前社會(huì)的重要命題,它雖然不是一個(gè)技術(shù)性問題,但的確能夠圈定AI的發(fā)展方向。
關(guān)于我們|版權(quán)聲明| 違法和不良信息舉報(bào)電話:010-84151598 | 網(wǎng)絡(luò)敲詐和有償刪帖舉報(bào)電話:010-84151598
Copyright ? 2008-2024 by {當(dāng)前域名}. all rights reserved