
面对着种类繁多的AI助手,你看出它们在具体生活问题方面的表现存在差异了吗?小红书的达芬奇AI,在回答像“什么奶茶最好喝” 这类问题之时,常常显得能力不足,远比不上抖音豆包的回答富有专业性且直接。
达芬奇的谨慎与保守
当被问询“最好”的产品之际,达芬奇的回应通常极为谨慎,它偏向于举荐多个产品或者店铺的合集笔记,而非单独举荐某一款,这样“端水”形式的回应,好像是平台为了防止为单一商家引来流量而设定的策略 。
此方式虽说把商业推广的嫌疑给规避掉了,然而却致使那些寻求明确建议的用户心生失望之情。用户所需求的是清晰的选择之处,可不是全方面都顾及周全的列表哟,这般情形在一定程度让AI助手的实用价值被削弱了。

指令理解的偏差问题
有的时候,达芬奇没办法精准地去执行用户所给出的指令,比如说,在被询问“静音键盘推荐”这个问题之时,它有可能就会转变话题,开始滔滔不绝地大谈特谈在小红书上面相对更热门的“静音轴体”这一类别,这体现出了AI在语义理解方面存在着不足。
存在这种状况,极有可能是由于AI径直抓取且拼接了有关热门笔记的文案,然而并未切实领会用户问题的关键所在。这般机械式的信息搬运行径,致使回答与需求出现错位 。

合作品牌的潜在偏向
有一种迹象显示出来,达芬奇于回答当中,针对小红书平台里的重点合作品牌,或许存在着倾斜的情况。比如说哈,在美妆这个领域,和平台有着深度营销合作关系的花西子等品牌,在推荐里出现的频率以及其展现出来的倾向性,可能会更高一些。

这般潜藏着的“开后门”之举,虽说于那般平台的商业合作有益处,然而它却对AI给出的回答的中立性以及公正性有所损害。用户内心所期望的乃是客观的信息,而不是那种隐形的广告。
知识性问题的短板
在问题从生活经验范畴跳出,转而通向知识范围之际,达芬奇身上的短板愈发显著可察 ,比如说,当被问及“历史上是否存在完美犯罪这种情况”时,它所给出的回应常常只是浮于表面,欠缺具体实在的案例以及深入细致的剖析 。

相较而言,存有一些通用型AI助手,像微信的元宝这般,于这类问题之上能够给出更为系统的、赋予更多信息量的回应,其中涵盖枚举多个历史实例的情况。这将达芬奇在通用知识整合能力方面的局限给揭示了出来,标点符号。
技术实现的制约因素

达芬奇所采用的核心技术路径,或许过度倚赖单纯的检索增强生成,也就是RAG,然而在更为复杂的智能体架构方面存在不足,就造成了它的回答质量缺乏稳定性,且深度有所欠缺。
海量优质的图片与视频,于平台而言,当前尚未能得到有效运用。因缺失OCR等识别技术,达芬奇对这些媒介所承载的信息无法理解,从而致使宝贵的数据富矿被浪费了。

内容生态与AI的平衡难题
小红书自身是个具备强大功能的生活搜索工具,就算关键词不太清晰明确,也能够找寻到与之相关的内容 。可是呢,这样一种优势并没有完完整整、毫无偏差地复制到有着极高水准的达芬奇身上 。与此同时,该平台里所夹杂着的数量众多的软质广告,同样有可能使AI训练数据的质量被削弱 。
小红书必须解决的长期挑战是,怎样让AI为社区赋予能量,把用户体验提升起来,同时又不会将原有的内容生态以及信任感破坏掉,这需要技术在精准识别方面取得突破,且在价值观判断上也取得突破 。
你认为,一个切实懂得生活、能够给出可靠建议的人工智能助手,究竟应当更倾向于实用推荐,还是维持绝对中立呢?在评论区阐述你的看法吧。

发表评论