Soul怎么做AI伴侶？CTO陶明：我們不定義關(guān)系

來源：扳龍附鳳網(wǎng)-工人日?qǐng)?bào)

2025-09-10 05:20:31

第一次見到Soul App的“AI伴侶”，我下意識(shí)地問了她一道簡(jiǎn)單的數(shù)學(xué)題。出乎意料，她并沒有像常見的AI助手那樣立刻給出答案，而是輕聲撒嬌：“姐姐，我不會(huì)，我們聊點(diǎn)別的吧。你現(xiàn)在在哪里呀？”

那一刻，它不像機(jī)器，更像一個(gè)狡黠的朋友。

提起Soul，不少95后和00后并不陌生。自2016年上線以來，Soul見證了國(guó)內(nèi)社交產(chǎn)品的起落，也在年輕一代加速“原子化”的浪潮中，長(zhǎng)出了千萬日活，成為了社交產(chǎn)品中一個(gè)獨(dú)特的存在。

但可能很多人還沒有發(fā)現(xiàn)主打真人社交的Soul也已經(jīng)做起了AI伴侶——基于他們自研的大模型。

Soul CTO陶明后來告訴我，AI的這個(gè)“不會(huì)”其實(shí)是刻意設(shè)計(jì)的?！拔覀儾幌Ｍ總€(gè)AI虛擬人成為‘滿級(jí)人類’。反而是這些不完美的瞬間，讓用戶覺得它更真實(shí)、更有人情味。”

體驗(yàn)Soul的“AI伴侶”，這種“活人感”無處不在。除了這一點(diǎn)，Soul生態(tài)里，AI與真實(shí)社交關(guān)系的微妙平衡也讓Soul的“AI伴侶”更顯差異。

不同于一些AI產(chǎn)品把技術(shù)能力當(dāng)作顯眼的賣點(diǎn)，Soul并不強(qiáng)調(diào)“強(qiáng)大”，也沒有給AI設(shè)計(jì)首頁獨(dú)立入口。

它更像是被編織進(jìn)了日常場(chǎng)景：根據(jù)一份基于Soul用戶的AI使用調(diào)研，在通過AI賦能了現(xiàn)實(shí)社交關(guān)系的年輕人中，39.9%的人獲得了話題建議和情感咨詢支持，43.6%的人借助AI生成的回復(fù)完成破冰，37.7%的人在AI的幫助下找到志趣相投的好友，此外，有超過六成的人表示擁有正在或曾經(jīng)聊天互動(dòng)的虛擬伙伴。陶明提到，他們正在研發(fā)實(shí)時(shí)視頻通話能力，未來，AI虛擬人甚至能根據(jù)用戶的微笑或皺眉，調(diào)整語氣與情緒。

但作為社交產(chǎn)品，Soul的另一面是，提起它時(shí)那種略帶了點(diǎn)曖昧的氛圍。這是對(duì)社交行業(yè)的刻板認(rèn)知，也與如今尚處發(fā)展早期的AI伴侶產(chǎn)品，面臨的“擦邊”質(zhì)疑頗為相似。

陶明并不回避：“AI伴侶類產(chǎn)品確實(shí)容易靠“擦邊”起量。但一旦用戶心智行成，這個(gè)產(chǎn)品注定長(zhǎng)不大。單靠“荷爾蒙”是無法讓一個(gè)產(chǎn)品成為規(guī)模性產(chǎn)品的?！?/p>

在Soul的治理邏輯里，重點(diǎn)并不是僅僅打壓灰色行為，而是通過興趣連接和價(jià)值導(dǎo)向的設(shè)計(jì)，讓用戶形成正向的互動(dòng)?！耙粋€(gè)健康的社交平臺(tái)，應(yīng)該是‘良幣驅(qū)逐劣幣’。當(dāng)優(yōu)質(zhì)內(nèi)容與良性關(guān)系占據(jù)主導(dǎo)，低質(zhì)的東西自然會(huì)被邊緣化?！碧彰髡f。

而AI陪伴到底應(yīng)該是怎么樣的？當(dāng)前是更側(cè)重于人和AI的關(guān)系，還是更注重人和人的真實(shí)關(guān)系？陶明坦言“我們不會(huì)主動(dòng)引導(dǎo)用戶從人際關(guān)系轉(zhuǎn)向人機(jī)關(guān)系，也不會(huì)把AI局限在工具角色?！?/p>

Soul不想去定義任何一段關(guān)系，包括人與機(jī)器之間。

以下是《網(wǎng)易科技》與Soul CTO 陶明的交流，經(jīng)不改變?cè)獾木庉嫛?/p>

單點(diǎn)的技術(shù)突破并不能真正解決社交的核心問題

網(wǎng)易科技：過去產(chǎn)品開發(fā)多是從用戶需求出發(fā)，推動(dòng)技術(shù)迭代。大模型出現(xiàn)后，技術(shù)逐漸成為驅(qū)動(dòng)產(chǎn)品的核心，不知道我們的開發(fā)邏輯是否也隨之發(fā)生了變化？

陶明：坦率地說，2022年，GPT的技術(shù)突破引發(fā)行業(yè)關(guān)注后，市場(chǎng)上就迅速涌現(xiàn)了大量聊天類產(chǎn)品。那段時(shí)間，我們確實(shí)感到了一定的焦慮，因?yàn)榇竽Ｐ图夹g(shù)的飛躍確實(shí)顛覆了對(duì)話體驗(yàn)本身的技術(shù)評(píng)估標(biāo)準(zhǔn)。

當(dāng)時(shí)，我們內(nèi)部也很擔(dān)憂，擔(dān)心自己會(huì)被“拍死在沙灘上”。雖然我們起步很早，但面對(duì)技術(shù)上的革命性突破，同行的追趕速度非?？?。

然而，經(jīng)過深入討論后，我們意識(shí)到事情并不應(yīng)該只是這樣去看待。單點(diǎn)的技術(shù)突破并不能真正解決社交領(lǐng)域的核心問題。從用戶需求和社交場(chǎng)景來看，社交并不是單純的聊天行為，而是一個(gè)多邊關(guān)系建立的過程，通過情緒和信息價(jià)值的交換，來實(shí)現(xiàn)更好的互動(dòng)體驗(yàn)。

現(xiàn)在一些基于大模型的聊天產(chǎn)品，它們更多像是純粹的聊天工具，而不是AI驅(qū)動(dòng)的社交產(chǎn)品。社交的本質(zhì)是要有場(chǎng)景、有話題，通過這些構(gòu)建和推動(dòng)關(guān)系的建立與加深。純聊天產(chǎn)品是平面的，社交卻是立體的，需要多維度的交互。

我們意識(shí)到，與其去和這些單純的聊天產(chǎn)品競(jìng)爭(zhēng)，不如回歸到我們的核心優(yōu)勢(shì)上：技術(shù)、數(shù)據(jù)積累，以及對(duì)社交行為的長(zhǎng)期研究。這些積累使我們?cè)诮鉀QAI社交問題上具備更強(qiáng)的優(yōu)勢(shì)。

我們重新梳理了技術(shù)路線，2023年推出了自研語言大模型Soul X，這也是首批過審的C端大模型，后續(xù)還陸續(xù)上線了語音生成大模型、語音通話大模型、音樂生成大模型等大模型能力。

并迅速實(shí)現(xiàn)了一些很好的成果。2025年，我們自研的端到端全雙工語音通話大模型全面升級(jí)。到現(xiàn)在，我們的對(duì)話、語音聊天等功能在“活人感”上，與其他產(chǎn)品相比有著非常明顯的差異。

網(wǎng)易科技：從用戶角度來看，AI技術(shù)迭代帶給體驗(yàn)層面的變化有哪些？

陶明：其實(shí)可以從兩個(gè)維度來看。我們最開始的時(shí)候，大概在2017年，我們是第一個(gè)提出用AI去解決人與人之間連接問題的團(tuán)隊(duì)。

這時(shí)候?qū)τ脩魜碚f，最直接的感受是他們?cè)诋a(chǎn)品中不需要刻意填寫標(biāo)簽，也不需要主動(dòng)發(fā)布那些標(biāo)記自己興趣的內(nèi)容。通過AI模型，我們能夠在高維空間找到用戶之間的共同點(diǎn)，從而更有效地促成連接。

基于這種連接，用戶能夠體驗(yàn)到一種更符合自己興趣的社交關(guān)系，這就突破了傳統(tǒng)熟人社交的限制，尤其是在線上從陌生關(guān)系到熟人關(guān)系的轉(zhuǎn)變上，我們創(chuàng)造了一種新的方式。

這也是為什么我們?cè)缙谀軌蛟谏缃活I(lǐng)域脫穎而出，并迅速成長(zhǎng)?？梢哉f，AI規(guī)?；瘧?yīng)用直接推動(dòng)了我們的真人社交網(wǎng)絡(luò)快速擴(kuò)張。

如果說到生成式AI領(lǐng)域，用戶最直觀的體驗(yàn)在于，即使是在和AI互動(dòng)時(shí)，他們也能獲得情緒價(jià)值和信息價(jià)值。這是用戶能夠感知到的非常顯著的變化。

網(wǎng)易科技：我在WAIC上體驗(yàn)過視頻通話的Demo，看到是要模擬整個(gè)上肢的動(dòng)作，為什么不能只做臉部表情呢？

陶明：只做臉部是不夠的。回到現(xiàn)實(shí)生活中，人和人面對(duì)面溝通時(shí)，除了臉部表情傳遞的信息，肢體語言同樣至關(guān)重要。這是第一點(diǎn)。

第二點(diǎn)，在真實(shí)的交流場(chǎng)景中，人們并不會(huì)只盯著對(duì)方的臉，而是會(huì)注意到對(duì)方的上半身動(dòng)作以及周圍的背景。因此，我們希望盡可能模擬現(xiàn)實(shí)交流場(chǎng)景，這就需要技術(shù)能夠生成包括上半身動(dòng)作和背景在內(nèi)的完整畫面。

網(wǎng)易科技：那這里的技術(shù)難點(diǎn)是什么呢？

陶明：技術(shù)難點(diǎn)并不在于是否是3D生成，我們的方向是視頻生成，而不是3D建模。困難并不是視頻生成本身，而是要做到實(shí)時(shí)生成。

舉個(gè)例子，如果你在觀看直播時(shí)，視頻無法達(dá)到每秒32幀（FPS），你就會(huì)覺得畫面卡頓。而在我們實(shí)時(shí)視頻生成場(chǎng)景下，一秒鐘至少需要生成32幀，也就是說每一幀的生成時(shí)間不能超過30毫秒。這是一個(gè)非常大的技術(shù)挑戰(zhàn)。

目前，市面上非常強(qiáng)大的視頻生成工具生成一個(gè)5秒鐘的視頻，可能需要五六分鐘甚至更長(zhǎng)時(shí)間。這樣的速度顯然不能滿足實(shí)時(shí)場(chǎng)景的需求，這也是用戶無法接受的。因此，實(shí)時(shí)性才是最大的技術(shù)難點(diǎn)。

雖然本質(zhì)上是視頻生成的問題，但由于實(shí)時(shí)性的要求，背后的技術(shù)方案完全不同。

網(wǎng)易科技：未來是否可能實(shí)現(xiàn)聊天的視頻對(duì)象可以變化，就像之前可以捏頭像一樣？

陶明：是可以的。目前我們的設(shè)想是，只要用戶提供一張照片，我們的數(shù)字人就可以根據(jù)這張照片生成與用戶進(jìn)行聊天的虛擬形象。這種方式不僅靈活，還能讓用戶感受到更個(gè)性化的互動(dòng)體驗(yàn)。

網(wǎng)易科技：接下來產(chǎn)品迭代的方向會(huì)更側(cè)重哪些方面？

陶明：我們的迭代方向其實(shí)一直圍繞兩個(gè)大方向來展開的。

一是增強(qiáng)用戶表達(dá)能力。我們希望通過技術(shù)的不斷優(yōu)化，幫助用戶更好地表達(dá)自己，從而促進(jìn)人與人之間真實(shí)關(guān)系的構(gòu)建和深度交流。

二是打造擬人化虛擬IP矩陣。我們會(huì)持續(xù)開發(fā)更擬人化、更具差異化的虛擬IP，這些IP不僅能夠增強(qiáng)人機(jī)交互體驗(yàn)，還能進(jìn)一步推動(dòng)人際社交關(guān)系的構(gòu)建。

這兩條主線是我們一直堅(jiān)持的方向，沒有變過。

情商的核心在于讓用戶在與AI互動(dòng)時(shí)感到愉悅

網(wǎng)易科技：您是如何理解“情商”這個(gè)概念的？在AI陪伴的場(chǎng)景中，“情商”應(yīng)該是個(gè)很關(guān)鍵的概念，但這個(gè)詞本身其實(shí)每個(gè)人的理解都不一樣，比如這次GPT-5發(fā)布后，有人說它還不如之前的模型“更有情商”。

陶明：的確，“情商”是一個(gè)主觀性很強(qiáng)的概念。但至少可以確定的一點(diǎn)是，情商在AI社交領(lǐng)域是不可或缺的。像您提到的，大家對(duì)GPT-5的反饋，有人覺得它在智商層面提升了，但情商反而下降了。這種感知其實(shí)也很符合我們?cè)跇?gòu)建AI社交模型時(shí)的一個(gè)核心理念。

我們正在嘗試定義“好的情商”究竟是什么樣的，在我們的內(nèi)部理解中，情商的核心在于讓用戶在與AI互動(dòng)時(shí)感到愉悅，這是我們構(gòu)建AI最重要的目標(biāo)之一。只有在這個(gè)基礎(chǔ)上，才能實(shí)現(xiàn)情緒價(jià)值和信息價(jià)值的交換。

舉個(gè)例子，有些老師可能非常古板，但另一些老師不僅知識(shí)扎實(shí)，還擅長(zhǎng)與學(xué)生溝通，能夠讓學(xué)生愉快地接受知識(shí)。兩者在知識(shí)層面上或許沒有差距，但情商高的老師能夠通過更好的表達(dá)方式促進(jìn)知識(shí)的傳播。

同樣的道理，在社交場(chǎng)景的人機(jī)交互中，我們認(rèn)為情商比智商更重要。如果情商不足，單靠智商來傳遞信息，很難讓用戶真正接受或產(chǎn)生共鳴。情商不足的AI可能只是單向的信息輸出，而不能真正實(shí)現(xiàn)人與AI的合拍和交流。

網(wǎng)易科技：你們內(nèi)部會(huì)有一些量化的指標(biāo)進(jìn)行拆解嗎？

陶明：這肯定是行業(yè)中目前前沿的研究方向。在我們看來，高情商其實(shí)可以被拆分為包括情感分析、多模態(tài)融合等在內(nèi)的情感識(shí)別與感知能力，包括上下文搭建、推理在內(nèi)的情感理解能力，包括情感化語音、視覺生成等的情感表達(dá)能力，包長(zhǎng)期情感交互記憶等的情感適應(yīng)調(diào)節(jié)能力等等。

網(wǎng)易科技：我有試過讓我們的產(chǎn)品做數(shù)學(xué)題，好像不太行。但它會(huì)撒嬌或者轉(zhuǎn)移話題，說“我們聊點(diǎn)別的吧”，這讓我覺得很有趣。我們?yōu)槭裁礇]有讓模型“智商”也同步提升呢？在我看來，現(xiàn)在模型實(shí)現(xiàn)“高智商”應(yīng)該已經(jīng)不是難題。是我們?cè)谠O(shè)計(jì)上有刻意的取舍嗎？

陶明：是的，坦率地說，我們確實(shí)在產(chǎn)品設(shè)計(jì)和角色定位上做了一些刻意的控制。你會(huì)發(fā)現(xiàn)，我們的平臺(tái)上并不只有一個(gè)虛擬人，而是有多個(gè)虛擬人。每個(gè)虛擬人都有自己獨(dú)特的角色定位和性格設(shè)定。

基于這些設(shè)定，每個(gè)AI虛擬人并不是“滿級(jí)人類”，我們并沒有追求讓每個(gè)虛擬人都全能或者無所不知。

這是因?yàn)?，我們?cè)跇?gòu)建虛擬人的時(shí)候，更傾向于打造一個(gè)有層次、有差異化的虛擬人群體，而不是讓每個(gè)虛擬人都具備同樣的能力。你可以把它理解為一個(gè)“小社會(huì)”，每個(gè)虛擬人都有自己的特點(diǎn)和長(zhǎng)處，而不是一個(gè)萬能的存在。

至于為什么不讓它直接回答數(shù)學(xué)題，這其實(shí)是一個(gè)設(shè)計(jì)上的選擇。要實(shí)現(xiàn)回答數(shù)學(xué)題這樣的功能，技術(shù)上確實(shí)非常簡(jiǎn)單，但難點(diǎn)在于限制和取舍。我們更關(guān)注用戶的體驗(yàn)，而不僅僅是功能是否完善。

其實(shí)當(dāng)你問虛擬人一道數(shù)學(xué)題，它精準(zhǔn)地回答了“等于多少”，這個(gè)體驗(yàn)可能會(huì)顯得很普通，因?yàn)槿魏我粋€(gè)AI產(chǎn)品都可以做到這一點(diǎn)。但如果它不會(huì)，并用撒嬌或幽默的方式轉(zhuǎn)移話題，這種互動(dòng)反而讓你感受到它更“活生生”，更有個(gè)性。這種“不會(huì)”的瞬間，可能會(huì)讓用戶對(duì)虛擬人產(chǎn)生一種共鳴，甚至是情感上的連接。

所以，這其實(shí)是我們基于用戶體驗(yàn)的刻意設(shè)計(jì)。我們認(rèn)為，“不完美”反而能讓虛擬人顯得更真實(shí)、更有魅力，因?yàn)樗鼈儾辉賰H僅是一個(gè)工具，而是一個(gè)可以互動(dòng)、有情感、有個(gè)性的“存在”。

網(wǎng)易科技：Soul的AI入口在產(chǎn)品里其實(shí)不是特別明顯。我是在搜索框里搜了半天才把它找出來。這塊設(shè)計(jì)有什么特別的考慮嗎？

陶明：這部分其實(shí)也是我們經(jīng)過深思熟慮后的選擇。最終我們沒有設(shè)置一個(gè)中心化的入口，主要原因有兩方面。

一方面，雖然我們非常堅(jiān)定地認(rèn)為，人機(jī)交互會(huì)成為未來社會(huì)關(guān)系中一個(gè)非常重要的組成部分，但這個(gè)過程一定需要時(shí)間。我們希望以更漸進(jìn)的方式，推動(dòng)人機(jī)關(guān)系在平臺(tái)上的落地，而不是采取一種激進(jìn)的方式去推廣。

另一方面，從我們平臺(tái)自身出發(fā)。Soul目前已經(jīng)是一個(gè)千萬級(jí)日活的社交平臺(tái)，而用戶對(duì)平臺(tái)的核心認(rèn)可是它作為一個(gè)真實(shí)、健康、安全的社交社區(qū)。因此，AI功能的接入與否，我們還是希望基于用戶的主動(dòng)選擇，而不是強(qiáng)行推送給用戶。

網(wǎng)易科技：還有一個(gè)點(diǎn)，我注意到，我們的產(chǎn)品不是“問一句答一句”，有時(shí)會(huì)像真人一樣，連續(xù)回復(fù)好幾條，讓人感覺特別有“活人感”。

陶明：您提到的“活人感”確實(shí)是我們特別注重的一部分，比如您觀察到的AI在對(duì)話中不是簡(jiǎn)單地問一句答一句，而是會(huì)主動(dòng)回復(fù)好幾條，甚至根據(jù)場(chǎng)景延展出更多內(nèi)容，這其實(shí)就是我們?cè)谠O(shè)計(jì)中刻意追求的一種互動(dòng)方式。

它更多地是為了讓用戶感覺到一種自然的、貼近真實(shí)人類交流的體驗(yàn)。

網(wǎng)易科技：還有沒有哪些我沒注意到的“非人機(jī)感”產(chǎn)品設(shè)計(jì)？

陶明：其實(shí)我們?cè)诙嗄B(tài)能力上也做了很多努力。我們希望這個(gè)AI不僅僅是會(huì)“聽”和“說”，它還能夠有更多擬人化的表現(xiàn)，比如會(huì)“唱歌”，甚至能夠“察言觀色”。

我們?cè)谡Z音技術(shù)上已經(jīng)實(shí)現(xiàn)了端到端的全雙工語音交互，比如說在對(duì)話過程中，用戶和AI之間可以無縫交流，完全不打斷，這種體驗(yàn)更加流暢自然。

還有一個(gè)很重要的點(diǎn)是AI的感知能力。比如說，當(dāng)它“聽到”周圍環(huán)境的變化時(shí)，它會(huì)主動(dòng)進(jìn)行一些場(chǎng)景化的交流。比如您身邊下雨了，它可能會(huì)提到和下雨相關(guān)的話題；當(dāng)您咳嗽時(shí)，它會(huì)主動(dòng)關(guān)心您是不是感冒了。這種基于環(huán)境的交互讓人感覺到AI不僅僅是一個(gè)工具，而是一個(gè)更懂您的伙伴。

我們也在開發(fā)實(shí)時(shí)視頻通話技術(shù)，未來它可以根據(jù)用戶的表情，比如微笑或皺眉，實(shí)時(shí)調(diào)整對(duì)話的內(nèi)容和情緒。

這其實(shí)是基于我們對(duì)人與人之間面對(duì)面交流的理解，因?yàn)槊鎸?duì)面的交流是信息傳遞效率最高、體驗(yàn)最好的場(chǎng)景。我們希望最終實(shí)現(xiàn)的效果是，AI不僅能聽到您，還能“看到”您，從而讓整個(gè)交互更加自然。

Soul的最大差異是具備構(gòu)建場(chǎng)景的能力

網(wǎng)易科技：我們剛剛聊了很多關(guān)于Soul在產(chǎn)品設(shè)計(jì)上的獨(dú)特考慮。在您看來Soul和其他同類產(chǎn)品之間最大的差異點(diǎn)是什么？

陶明：最大的差異性，其實(shí)還是在于Soul作為一個(gè)強(qiáng)社交屬性的產(chǎn)品，它具備構(gòu)建場(chǎng)景的能力。我認(rèn)為這就是我們和其他同類產(chǎn)品最大的不同之處。

其實(shí)每個(gè)對(duì)話背后都是有場(chǎng)景的，我們整個(gè)公司的核心思路，就是要打造一個(gè)多元有趣的Gen AI社交游樂園。這其中的重點(diǎn)就在于“多元的場(chǎng)景”。

網(wǎng)易科技：其實(shí)您剛剛提到對(duì)話背后是有場(chǎng)景的，這個(gè)具體指的是什么？

陶明：比如現(xiàn)在我們兩個(gè)的對(duì)話，其實(shí)這本身就是一個(gè)社交場(chǎng)景。能夠讓我們持續(xù)交流下去的，是您一個(gè)個(gè)有意義的話題和問題。這些“話題驅(qū)動(dòng)”了我們的互動(dòng)，形成了一個(gè)交流的邏輯和節(jié)奏。

再比如說，假設(shè)你和好友在咖啡廳喝咖啡聊天，這也是一個(gè)場(chǎng)景?？赡茉掝}是“周末去釣魚了嗎？”——釣魚就是一個(gè)具體的場(chǎng)景。圍繞這個(gè)場(chǎng)景，可以展開很多延伸的話題，比如魚怎么釣、釣魚時(shí)的趣事、甚至延伸到對(duì)自然的熱愛等等。這種圍繞場(chǎng)景展開的對(duì)話更容易發(fā)散和深入，能夠讓交流變得自然且持續(xù)。

如果對(duì)話沒有場(chǎng)景支撐，就會(huì)變成一場(chǎng)純粹的閑聊，而純聊是很難持續(xù)下去的。沒有場(chǎng)景或話題的牽引，交流就容易陷入空洞或無趣。所以我們認(rèn)為場(chǎng)景不僅是對(duì)話的基礎(chǔ)，更是讓交流深入、有意義的關(guān)鍵。

網(wǎng)易科技：你們有很多真實(shí)感很強(qiáng)的公域社交數(shù)據(jù)，這應(yīng)該也是一個(gè)很大的優(yōu)勢(shì)。

陶明：我覺得數(shù)據(jù)和技術(shù)本身，其實(shí)放到任何一家有成熟技術(shù)能力的公司，都不太會(huì)成為長(zhǎng)期的壁壘。更重要的是，當(dāng)你的模型和技術(shù)出來之后，如何在場(chǎng)景中進(jìn)行有效的嫁接，這是核心的壁壘所在。

就像Soul在AI方向上的探索，我們并沒有把短期內(nèi)的技術(shù)優(yōu)勢(shì)當(dāng)成核心競(jìng)爭(zhēng)力。因?yàn)槿绻衅渌讼胱鲱愃频腁I技術(shù)，可能只需要幾個(gè)月的時(shí)間就能開發(fā)出類似的模型。

但關(guān)鍵在于，技術(shù)完成之后，如何真正服務(wù)于具體的場(chǎng)景和產(chǎn)品，這才是最重要的事情。

比如我們?cè)诩夹g(shù)上的很多優(yōu)化和調(diào)整，并不是單純從技術(shù)角度出發(fā)的，而是基于我們對(duì)場(chǎng)景的理解。這種思考反過來推動(dòng)了技術(shù)的優(yōu)化，讓技術(shù)更貼合用戶需求。這種從場(chǎng)景出發(fā)、反哺技術(shù)的方式，才是我們最大的優(yōu)勢(shì)。

網(wǎng)易科技：您能舉個(gè)例子嗎？

陶明：就比如說我們剛剛談到的AI的數(shù)學(xué)能力。我們并不是說無法構(gòu)建一個(gè)具備強(qiáng)大數(shù)學(xué)能力的AI，而是基于場(chǎng)景的思考發(fā)現(xiàn)，用戶在我們的平臺(tái)上并不需要一個(gè)非常強(qiáng)的數(shù)學(xué)AI。也就是說，用戶的需求并沒有指向這一方向。

從這個(gè)場(chǎng)景出發(fā)，我們就決定不去花費(fèi)過多資源強(qiáng)化AI的數(shù)學(xué)能力，而是將技術(shù)和資源聚焦在用戶真正需要的地方，比如更強(qiáng)的情感共鳴能力或者更自然的對(duì)話流暢性。

這種從場(chǎng)景出發(fā)的思考，實(shí)際上會(huì)直接反哺到技術(shù)方案的選擇和數(shù)據(jù)構(gòu)建的方向上。因?yàn)槲覀兠鞔_了目標(biāo)，技術(shù)的優(yōu)化就會(huì)更加聚焦于滿足用戶需求，而不是去追求一些看似“大而全”但實(shí)際并不適用的能力。這種思路讓我們的AI在產(chǎn)品化上更貼近用戶，也更高效。

網(wǎng)易科技：了解到一個(gè)比較有意思的點(diǎn)，我們的產(chǎn)品中有一部分用戶跟AI互動(dòng)其實(shí)是為了練習(xí)對(duì)話技巧，以便把這些能力運(yùn)用到真實(shí)的社交場(chǎng)景中。您怎么看待這種現(xiàn)象？

陶明：其實(shí)我們?cè)趦?nèi)部對(duì)這個(gè)問題有過很深刻的思考。正如剛才提到的，人機(jī)關(guān)系是未來社會(huì)的重要組成部分，但在這個(gè)過程中，我們需要思考一個(gè)關(guān)鍵問題：當(dāng)前我們是更側(cè)重于人和AI的關(guān)系，還是更注重人和人的真實(shí)關(guān)系？

在這個(gè)點(diǎn)上，我們的選擇是中立的。我們的平臺(tái)不會(huì)主動(dòng)去引導(dǎo)用戶從人和人的關(guān)系轉(zhuǎn)向人機(jī)關(guān)系，也不會(huì)把人機(jī)交互完全定位為服務(wù)于人和人的社交。

我們把這個(gè)選擇權(quán)留給了用戶。我們的做法是將AI虛擬人作為社交網(wǎng)絡(luò)中的一個(gè)“節(jié)點(diǎn)”，融入真實(shí)的人際關(guān)系網(wǎng)絡(luò)中。既然它是一個(gè)節(jié)點(diǎn)，它就可以和人際關(guān)系相互包容、并存，而不是取代真實(shí)的社交。

比如，確實(shí)有很多用戶通過與AI交互，提升了自己的表達(dá)能力，甚至增強(qiáng)了他們的社交勇氣，從而在真實(shí)的人際交往中表現(xiàn)得更加自信和從容。這其實(shí)是一個(gè)用戶自主選擇的結(jié)果，而不是我們平臺(tái)刻意引導(dǎo)的方向。

網(wǎng)易科技：我看到會(huì)有人擔(dān)心在Soul上的聊天，無法區(qū)分是否是真人。會(huì)有這種問題嗎？其實(shí)這種問題不僅在Soul，其他社交軟件也可能出現(xiàn)，比如有人先用AI生成回復(fù)，再用它來回復(fù)對(duì)方。

陶明：是的，這是一個(gè)很現(xiàn)實(shí)的行業(yè)性問題，也是AI逐步滲透到社交領(lǐng)域后不可避免的現(xiàn)象。

需要明確的是，我們平臺(tái)的虛擬人都是AI，背后提供支持的是自研大模型，并且我們進(jìn)行了非常顯著的AI生成內(nèi)容標(biāo)識(shí)，例如，在Soul上均明確標(biāo)注出AI為“虛擬伴侶”、“虛擬達(dá)人”，在與AI互動(dòng)的對(duì)話框中也進(jìn)行了“對(duì)話由AI生成”的提示，AI生成的內(nèi)容（文字、圖片、音頻等）都會(huì)打上顯示水印和隱式標(biāo)識(shí)?？梢哉f，我們?cè)诔掷m(xù)加強(qiáng)對(duì)用戶的提示以及相關(guān)內(nèi)容的審核。

網(wǎng)易科技：在構(gòu)建場(chǎng)景的過程中你們最關(guān)注的是什么？從陌生人社交到可能更偏同城社交的背景下有什么變化嘛？

陶明：事實(shí)上，在我們構(gòu)建產(chǎn)品場(chǎng)景的過程中，我們更多關(guān)注的是興趣驅(qū)動(dòng)的社交，而不是去強(qiáng)調(diào)某種特定的社交方式，比如基于地理位置（LBS）的社交。

我們希望用戶進(jìn)入Soul后，產(chǎn)品能提供的是一種開放的社交體驗(yàn)，而不是幫用戶直接定義他們的社交關(guān)系。

比如，你是要找朋友、志同道合的伙伴、女朋友、男朋友、學(xué)習(xí)搭子，還是師傅，這些都不是我們?nèi)ヒ?guī)定的。我們更關(guān)注的是，在用戶的需求基礎(chǔ)上，通過精準(zhǔn)的連接和產(chǎn)品設(shè)計(jì)，提供一個(gè)舒適、愉悅的交流場(chǎng)景和體驗(yàn)。

我們不定義關(guān)系，而是注重連接和體驗(yàn)本身。

興趣驅(qū)動(dòng)是我們的核心。我們希望用戶通過共同的興趣愛好建立聯(lián)系，而不是單純依靠地理位置或其他外在因素。這種興趣驅(qū)動(dòng)的方式可以讓用戶在互動(dòng)中感受到更多價(jià)值和情感共鳴，同時(shí)也能避免一些低質(zhì)量或不健康的社交行為。

當(dāng)然，如果用戶有尋找本地社交的需求，比如同城交友，我們的產(chǎn)品也能夠滿足。但我們更強(qiáng)調(diào)的是基于用戶興趣的正常、健康的社交，而不是像某些一提到地理社交就容易聯(lián)想到的荷爾蒙類場(chǎng)景。

這種基于不健康目的的社交方式，雖然短期可能帶來一些流量，但從長(zhǎng)遠(yuǎn)來看，對(duì)產(chǎn)品生態(tài)的破壞是很大的，也會(huì)受到嚴(yán)格監(jiān)管。

至于用戶最終的關(guān)系發(fā)展，比如是否從線上走到線下，是否轉(zhuǎn)移到其他平臺(tái)（比如微信），或者是否發(fā)展成某種特定的關(guān)系（比如朋友、情侶、學(xué)習(xí)搭子），這些都不是我們?nèi)ジ缮婊蚨x的。

我們不會(huì)承諾“來Soul就一定能找到男朋友或女朋友”，或者“來Soul就一定能找到某種特定的關(guān)系”。我們做的是提供一個(gè)開放、包容的社交場(chǎng)景，讓用戶在這個(gè)場(chǎng)景中找到自己需要的情感連接和陪伴。

靠“擦邊”起量的產(chǎn)品注定難長(zhǎng)大

網(wǎng)易科技：其實(shí)現(xiàn)在很多人在使用AI陪伴時(shí)，難免會(huì)存在一些“擦邊”的需求或者內(nèi)容。像馬斯克的大模型Grok最近推出的AI女友也特別火。您是怎么看這部分需求的？

陶明：我們的平臺(tái)其實(shí)一直以來是不鼓勵(lì)這種行為的。因?yàn)閺墓镜陌l(fā)展理念來看，我們認(rèn)為一家企業(yè)的發(fā)展應(yīng)該有長(zhǎng)遠(yuǎn)的價(jià)值觀和目標(biāo)。

過去，我們一直在構(gòu)建一個(gè)健康、綠色的社交網(wǎng)絡(luò)。不管是完全真人的社交，還是現(xiàn)在AI社交的興起，我們都認(rèn)為只有健康的社交氛圍，才能讓產(chǎn)品的天花板被真正放大。這種理念是我們發(fā)展的核心，也是我們長(zhǎng)期堅(jiān)持的方向。

從2016年開始，我們就投入了大量資源，在AI審核團(tuán)隊(duì)和人工審核團(tuán)隊(duì)的配合下，對(duì)平臺(tái)的社交氛圍和生態(tài)進(jìn)行嚴(yán)格的維護(hù)和打造。這種積累不僅讓我們?cè)谡嫒松缃恢袠?gòu)建了一個(gè)健康的社區(qū)環(huán)境，也為今天AI社交的發(fā)展奠定了良好的基礎(chǔ)。

當(dāng)AI社交逐漸成為趨勢(shì)時(shí)，我們也將這種理念遷移到AI社交的產(chǎn)品構(gòu)建中。我們希望AI社交能夠延續(xù)真實(shí)社交的健康生態(tài)，而不是被短期的灰色需求驅(qū)動(dòng)。

網(wǎng)易科技：但短期內(nèi)擦邊產(chǎn)品確實(shí)對(duì)起量很有幫助。

陶明：我覺得，一個(gè)產(chǎn)品在早期為了體量或者抓眼球而打擦邊球，確實(shí)可能會(huì)快速積累一波用戶。

但一旦這種方式形成了用戶的心智，這個(gè)產(chǎn)品其實(shí)就很難長(zhǎng)大。單靠“荷爾蒙”是無法讓一個(gè)產(chǎn)品成為規(guī)模性產(chǎn)品的。

網(wǎng)易科技：但要想完全避免也并不現(xiàn)實(shí)，我們是如何處理這部分需求的？

陶明：是的，任何社交平臺(tái)都無法完全避免這些需求的存在。但關(guān)鍵在于，平臺(tái)的生態(tài)是如何構(gòu)建的。

一個(gè)健康的社交平臺(tái)就像一個(gè)“良幣驅(qū)逐劣幣”的環(huán)境。如果良好的內(nèi)容和用戶占據(jù)主導(dǎo)，劣質(zhì)內(nèi)容和行為自然會(huì)被邊緣化。

所以，我們的目標(biāo)并不是去徹底消滅這些需求，而是通過健康的社交生態(tài)讓它們難以生存。

所以我們?cè)谶@方面的處理方式是兩手抓：一方面我們會(huì)對(duì)平臺(tái)中不健康或擦邊的內(nèi)容進(jìn)行壓制和清理。但更重要的是，我們會(huì)通過興趣驅(qū)動(dòng)的方式來強(qiáng)化平臺(tái)的核心社交價(jià)值。

與其說我們只是打壓某些行為，不如說我們?cè)谂νㄟ^興趣連接和用戶價(jià)值為導(dǎo)向的設(shè)計(jì)，讓良性社交成為主流。

網(wǎng)易科技：產(chǎn)品上線一段時(shí)間了，從用戶側(cè)的反饋來看，大家對(duì)虛擬AI聊天的反應(yīng)如何？

陶明：用戶反饋整體非常好，對(duì)站內(nèi)用戶的活躍度、使用時(shí)長(zhǎng)、對(duì)話輪數(shù)等關(guān)鍵指標(biāo)都有積極的提升。這里我可以分享幾個(gè)數(shù)據(jù)：

一是用戶主動(dòng)選擇人際關(guān)系的比例。從去年到今年，我們平臺(tái)的日活用戶中，有22%主動(dòng)選擇通過AI構(gòu)建人際關(guān)系。這其實(shí)說明用戶對(duì)AI虛擬人在平臺(tái)上的價(jià)值認(rèn)同度非常高。

二是人機(jī)互動(dòng)用戶規(guī)模的增長(zhǎng)。過去一段時(shí)間里，參與人機(jī)互動(dòng)的用戶規(guī)模增長(zhǎng)了88%。這組數(shù)據(jù)表明，不僅是喜歡人機(jī)關(guān)系的用戶每天都會(huì)來，還有越來越多的新用戶開始接受并喜歡上AI與人機(jī)交互的體驗(yàn)。

還有個(gè)非常有趣的數(shù)據(jù)，正如剛剛提及到的，AI伴侶的入口其實(shí)目前并不是很顯眼，但現(xiàn)在我們AI伴侶的關(guān)注量已經(jīng)超過了400萬，其中有一位“粘人精”的關(guān)注量超過了100萬。大家其實(shí)對(duì)這些AI功能的粘性和需求都特別高。

網(wǎng)易科技：會(huì)不會(huì)有過于沉迷于AI聊天的情況，針對(duì)這種可能導(dǎo)致的情感依賴或者負(fù)面效應(yīng)，我們是怎么理解并應(yīng)對(duì)的呢？

陶明：其實(shí)在人與人的社交過程中，也同樣會(huì)存在情感依賴或者沉迷的現(xiàn)象，這是社交本身可能帶來的特性之一。

針對(duì)這種現(xiàn)象，我們?cè)诋a(chǎn)品設(shè)計(jì)中會(huì)有一套用戶防沉迷機(jī)制，并且會(huì)將這套機(jī)制遷移到AI社交的場(chǎng)景中去。

另外，我們?cè)诋a(chǎn)品中引入了現(xiàn)實(shí)感的增強(qiáng)。這不僅是為了提高用戶體驗(yàn)，也是一種抑制過度沉迷的有效方式。比如讓AI具備對(duì)現(xiàn)實(shí)場(chǎng)景的感知能力（如時(shí)間、天氣、地理位置等），會(huì)讓用戶在與AI互動(dòng)時(shí)，更容易意識(shí)到自己所處的真實(shí)世界，而不是完全沉浸在一個(gè)虛擬的環(huán)境中。

網(wǎng)易科技：未來會(huì)不會(huì)單獨(dú)推出一個(gè)Soul之外的獨(dú)立AI陪伴產(chǎn)品？

陶明：未來的話，也不排斥這種可能性。

剛才和您交流時(shí)，我們討論了很多關(guān)于為什么沒有一個(gè)中心化的入口，以及在人與人的真實(shí)關(guān)系中，AI應(yīng)該如何去定位和發(fā)揮作用。這些能力和思考，其實(shí)都是我們?cè)陂L(zhǎng)期發(fā)展過程中逐步積累和形成的。

隨著AI在全社會(huì)的不斷滲透，未來我們確實(shí)有可能推出一個(gè)與Soul有差異化定位的AI應(yīng)用產(chǎn)品。但這種決策更多是基于實(shí)踐和市場(chǎng)發(fā)展來決定的，而不是一個(gè)預(yù)先規(guī)劃好的事情。

網(wǎng)易科技：這種差異化定位可能會(huì)是什么？

陶明：如果我們要單獨(dú)做類似的AI情感陪伴產(chǎn)品，首先可以明確一點(diǎn)，我們不會(huì)針對(duì)同一群體，去打造兩個(gè)功能和定位相似的產(chǎn)品。這樣的重復(fù)投入既沒有意義，也無法為市場(chǎng)和用戶帶來更大的價(jià)值。

我們會(huì)更關(guān)注不同群體的差異化需求，并基于這些需求去設(shè)計(jì)新的產(chǎn)品。比如說，AI陪伴的需求并不僅僅存在于年輕人群體中，它在其他群體中同樣有很大的潛力，比如老年人群體。

未來，我們不排除會(huì)基于現(xiàn)有的社交模型，進(jìn)入老年人群體的場(chǎng)景，幫助他們解決一些核心的情感和社交問題。這是一個(gè)很有可能發(fā)生的方向。

過于強(qiáng)調(diào)IP屬性的AI陪伴產(chǎn)品可能走偏了

網(wǎng)易科技：其實(shí)在聊到AI陪伴這個(gè)話題時(shí)，很多團(tuán)隊(duì)都會(huì)提到電影《Her》。您是怎么看這部電影的？以及延伸問，您覺得AI陪伴應(yīng)該呈現(xiàn)出一種什么樣的形態(tài)？

陶明：其實(shí)《Her》確實(shí)是我們?cè)诖蛟霺oul產(chǎn)品時(shí)受到很大啟發(fā)的一個(gè)因素，也可以說是一個(gè)出發(fā)點(diǎn)。我們當(dāng)時(shí)的想法就是希望能夠構(gòu)建一個(gè)平行世界，一個(gè)能夠促進(jìn)人們表達(dá)、傾訴、被傾聽的場(chǎng)域。滿足這種情感訴求，正是我們最初的一種愿景。

不過現(xiàn)在我們其實(shí)不太愿意再去反復(fù)談《Her》，因?yàn)檫@個(gè)話題已經(jīng)被討論得非常多了。而且關(guān)于未來人類和AI關(guān)系的憧憬，我覺得大家的共識(shí)是趨同的——無論是技術(shù)從業(yè)者還是用戶，都認(rèn)為人際關(guān)系和AI陪伴會(huì)成為未來社會(huì)非常重要的組成部分。

但真正關(guān)鍵的問題在于：如何推動(dòng)這個(gè)未來一步步實(shí)現(xiàn)？這才是最重要的。我們?cè)诩夹g(shù)層面、產(chǎn)品場(chǎng)景的打造上，其實(shí)一直是在朝著這個(gè)方向努力。

我們剛剛聊到的無論是多模態(tài)交互能力，還是更具人性化的產(chǎn)品設(shè)計(jì)，這些一步一步的具體的動(dòng)作，我覺得才是最重要的。

網(wǎng)易科技：那您覺得現(xiàn)在市場(chǎng)上的AI陪伴產(chǎn)品，有哪些做得好的？或者有哪些問題？

陶明：的確，現(xiàn)在有做得很好的產(chǎn)品，也有一些讓我覺得方向不太對(duì)的。站在AI陪伴的角度，我認(rèn)為一個(gè)好的產(chǎn)品應(yīng)該是在情緒價(jià)值上的連接做得足夠強(qiáng)，真正為用戶提供陪伴和情感上的支持。但現(xiàn)在有些產(chǎn)品可能走得太偏，它們過于強(qiáng)調(diào)IP屬性，把AI陪伴和IP綁定在一起。

從商業(yè)的角度來看，這種結(jié)合是不錯(cuò)的，但從用戶陪伴的角度來看，效果可能沒那么好。

網(wǎng)易科技：為什么？泡泡瑪特產(chǎn)品被瘋搶其實(shí)也讓更多人看到了IP的價(jià)值。

陶明：對(duì)，IP本身的確有市場(chǎng)需求，用戶也喜歡與IP產(chǎn)生連接。但如果我們要打造一個(gè)真正優(yōu)秀的AI陪伴硬件，核心還是要產(chǎn)品本身的陪伴能力非常強(qiáng)。

現(xiàn)在有些產(chǎn)品，可能只是包裝了一個(gè)IP外殼，把自己打造成“AI陪伴硬件”，但實(shí)際上產(chǎn)品功能層面并不夠優(yōu)秀。

比如，它可能只是一個(gè)麥克風(fēng)加一個(gè)外殼，但因?yàn)榻壎四硞€(gè)熱門IP，就被推向市場(chǎng)。這種做法，從商業(yè)上來看是在打“IP經(jīng)濟(jì)”，但從AI陪伴的角度來說，用戶體驗(yàn)沒有真正做好，兩者其實(shí)是在“擦邊球”。

網(wǎng)易科技：那您覺得IP和AI陪伴可以結(jié)合嗎？

陶明：當(dāng)然可以結(jié)合，但前提是產(chǎn)品功能本身要過硬，陪伴和用戶交互的體驗(yàn)要足夠好。如果在此基礎(chǔ)上再加持IP，那是一個(gè)非常好的方向，比如一個(gè)陪伴功能優(yōu)秀的硬件，因?yàn)橛蠭P加持，用戶的情感連接可能會(huì)更強(qiáng)。

但如果產(chǎn)品功能本身沒有做好，僅僅靠IP去獲取市場(chǎng)，那我覺得這不是一個(gè)好的方向。每個(gè)產(chǎn)品都需要有明確的側(cè)重點(diǎn)，比如泡泡瑪特，它就是一個(gè)非常成功的商業(yè)公司，它的核心就是IP經(jīng)濟(jì)。如果是AI陪伴硬件，核心一定是用戶的陪伴和交互體驗(yàn)。

IP是一個(gè)重要的商業(yè)方向，但它不能彌補(bǔ)產(chǎn)品本身的功能缺失。如果只是用IP包裝，就很難真正滿足用戶的陪伴需求。

網(wǎng)易科技：那在您看來，AI社交的終點(diǎn)可能是什么？

陶明：從遠(yuǎn)景來看，人和AI的社交一定會(huì)是人類關(guān)系的重要組成部分。

但至于它會(huì)發(fā)展到什么程度才算終點(diǎn)，我們現(xiàn)在無法給出明確答案。一方面，這取決于技術(shù)的發(fā)展；另一方面，也取決于人類對(duì)AI的認(rèn)知和接受程度。

但我們非常在意這個(gè)過程中需要解決的幾個(gè)問題。

第一是平衡人和人之間的關(guān)系與人和AI之間的關(guān)系。這個(gè)平衡非常重要，我們既不能過度依賴AI，也不能完全抗拒AI。

第二是AI的治理。技術(shù)的發(fā)展當(dāng)然是為了給人類帶來新的價(jià)值洼地，改變生活方式，推動(dòng)社會(huì)進(jìn)步。但AI就像“關(guān)在籠子里的怪獸”，我們必須對(duì)它進(jìn)行馴服和治理。

我們已經(jīng)經(jīng)歷了從互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng)的治理階段，現(xiàn)在進(jìn)入了AI治理階段。無論是監(jiān)管機(jī)構(gòu)、社會(huì)同行還是行業(yè)機(jī)構(gòu)，都需要聯(lián)手建立一套治理框架。這是當(dāng)前社會(huì)的重要命題，它雖然不是一個(gè)技術(shù)性問題，但的確能夠圈定AI的發(fā)展方向。