昨天,,百度搜索突然小范圍內測了對話式 AI ,,號稱對標 New Bing ,,還具有聯(lián)網能力,。
如果是真的,,那百度這回又是國內第一家整出有聯(lián)網功能大模型的公司了,。
巧了的是,,我也剛好拿到了資格,又能帶大家趕個熱乎的了,。
廢話不多說啊,,咱們就上手試試這個對標 New Bing 的百度新產品。
如果你是能搶先體驗的用戶,,在百度搜索界面的引導欄里,,你就能看到排在第一個的 AI 對話。
點進去之后,,整體的聊天界面非常簡潔。使用方法跟 New Bing 一樣,,都是對話形式,。
至于跟自己的親哥文心一言,,到底有啥區(qū)別,,它本人是這么說的。
不是一個東西,,不是一個模型,,甚至不是一家公司。
但據報道,,這個對話 AI ,,明明是基于文心一言開發(fā)的。
但考慮到New Bing 也曾“ 發(fā)表”過自己是百度家產品的炸裂言論,,畢竟對大語言模型來說,偶爾胡言亂語也算正常,。
這玩意真能聯(lián)網嗎?所以為了驗證它連上網線沒,,趕緊著問了道測聯(lián)網的問題:
百度發(fā)布智能手機,。
這回,,它給了我正確的回答,,并且貼上了資料來源的“百家號”鏈接。
起碼證明了,,百度的這個產品,,確實是能夠聯(lián)網的。
既然這樣,,咱們干脆來個橫評測試,,看看百度和New Bing兩個聯(lián)網大模型的能力到底誰比較厲害。
這不,,今天上午,,熱騰騰的 NBA 比賽剛剛結束。那第一題,,就問它們:NBA 最新比分,。
結果讓我有點吃驚, New Bing 和百度居然都犯了同樣的錯誤,。
兩個參賽選手抓取的網頁都是對的,,都貼了 NBA 官網的鏈接。
但是,,盡管已經翻到了對的那一頁,,兩個選手總結出來的比分都錯了。
熱火和尼克斯真正的比分是 103 : 112 ,湖人對勇士是 106 : 121 ,。
怎么對著答案抄,,居然都能抄錯的。
第一局,,雙方都沒得分,。
那第二題,,我們來點最近的互聯(lián)網熱梗——華語樂壇新四大天王。
雖然在我提示之后,,百度抓取到了正確的文章鏈接,,給出了一份對的人員名單。
但是,,當我追問到代表作的時候,,百度這小子又忘了,現在的華語樂壇,,到底誰是真天王了,。
至于 New Bing 這邊,,全程發(fā)揮穩(wěn)定,,一首“ 雪Distance ”驚艷全場。
這場華語樂壇角逐,,到底還是微軟技高一籌,。
第三題,,我覺得還是犯璞歸真,,聊聊咱們普通人搜索概率更大的問題。
結果,,百度可以通過調用百度天氣的數據,給你更精準的資料,,甚至還有一個賞心悅目的圖注,。
New Bing就有點傻傻分不清楚了,,直接把 “ 接下來5天 ” 理解成了過去 5 天的天氣情況,。
1比1平,局面頓時焦灼了起來,。
那決勝的最后一題,,我想試一些聯(lián)網功能,給日常生活帶來的便利,。
這里,,我讓它們給我規(guī)劃一下路線:從創(chuàng)景路到 in77 最快的路線。
本來,,百度有自家的百度地圖,我覺得這一局,,應該是百度穩(wěn)贏,。
結果出乎意料的是,, New Bing 居然抄著百度的家伙,把百度 AI 給碾壓了,。
New Bing 直接調用了百度地圖,,很快就規(guī)劃出了一條可用的路線。
雖然答案稍微有點小問題,,因為 19 號線地鐵剛剛開通到創(chuàng)景路,。New Bing 提供的 5 號線,已經不是最快方案了,。
但是,不管怎么說,,比百度的回答好。
它給出的幾個路線全都不對,,尤其是第一條步行的建議,,更是相當炸裂。
創(chuàng)景路距離 in77 有 19 公里,,一刻不停的走,,也得走 4 個小時 34 分鐘。
但經過北京小伙伴的測試,,它其實是能用調用百度地圖的。
至于究竟是怎么一個調用邏輯,,咱家不太清楚了,。
這么幾輪血戰(zhàn)下來,,在 New Bing 面前,,百度還是略顯遜色的。
總的來看,,百度的搜索 AI 肯定是有聯(lián)網能力的,,這個是沒有異議的。
但可能因為還是內測,,使用起來很不穩(wěn)定,,比如抓取的資料內容質量不高、對鏈接文章內容總結不準確等等,。
只不過讓我比較納悶兒的是,,有些時候,這個對話 AI 可能還不如身為“離線劃水”的文心一言來的靠譜,。
就拿我們首測文心一言的經典案例“松鼠桂魚的做法”來說,。
如果說文心一言平平淡淡的發(fā)言只能給 60分的話,。
那這個對話 AI ,,就只能算 30分,。
答案不夠詳細就算了,甚至還在抄人家卷子的時候,,把隔壁同學的名字都給抄過來了,。
引用鏈接里,人家分享說自己“廚房燈光暗,,改刀看不清楚,!”,百度把這種“口水話”都照搬上去,。
這不是無腦打小抄的小學僧嘛,。
當然了,,這也不能全怪百度,。
我覺得,主要還是目前互聯(lián)網上,,互相都不夠開放的原因,。比如百度就不容易抓到微信上的內容。
再加上,,百度AI引用的鏈接更傾向是百度百科等百度系的內容,,自產直銷。
這么一來,,導致參考的資料可能不夠多元,就容易出問題,。
不過,針對這個問題,,已經把 AI 玩出花來的編輯部同事,,就給我安利了一個小妙招。
可以通過英文互聯(lián)網的資料譯回中文,,直接曲線救國,。
還真別說,,內容質量好像有肉眼可見的提高,。
但是,引用不準確還可以理解,一些基本大模型能力,,怎么也比文心一言遜色不少,。
后面又試了幾道弱智吧問題,基本招招致命,。
怎么還質疑起游戲NPC造假了
關于“張三差點沒上上上上海的車”的問題,明明它差一點就理解對了,。
結果,當我給它開個了后門——再給他一次機會的時候,,他不僅直接選擇“擺爛“,,甚至還通過引用數據來嚇唬我。
讓你引用數據的時候,,引用錯了,頂嘴的時候,,又引用得比誰都快,。
當然了,,百度這次的新產品,也不是沒有優(yōu)化升級的,。
除了聯(lián)網之外,,還跟Bing一樣,支持對話文成圖,,甚至在頁面左下角,,開了一個叫“靈感中心”的東西。
里面全都是各種 AI 生成的小工具,,比如解夢,、抽象畫,甚至還有賽博求簽,。
粗看起來,,是有點兒AI應用商店那味兒了。
而且,,在使用過程中,我發(fā)現這個對話 AI ,,好像一直致力于給你解決更具體的問題,。
既然它這么渴望,,我就給他們來一道加時賽——應用題,。
說實話,光看這個標題倒是挺驚艷的,。
結果,我想讓百度順便給我生成對應圖片的時候,,它就罷工了,。
這牛脾氣,真不知道是跟誰學的,。
最后,我只能指名道姓地說出描述對象,,讓它給我畫個歐洲早餐店圖,。
當然,出于合規(guī)的要求,,還是會顯示 AI 作圖的水印,,這該死的求生欲。
為了公平起見,,我們也用 New Bing 重復了這個步驟,分別生成了一段文案和一張圖,。
最后,,咱們把兩個圖片和文案,,同時丟到小紅書上??纯吹降渍l的效果更好,。
雖然百度的瀏覽量會越高一絲,但是 Bing 比百度多了兩個點贊數,。所以這道題就算是開放式題目了,,具體哪個更好,相信每個茶友都有自己的答案,。
最后總結一下,整體玩下來,,還是能感覺到百度這產品和 New Bing 的客觀差距,。
但是考慮到,,這只是初代版本,并且也還只是在小范圍測試,,以目前 AI 的更新速度來看,,相信很快就會有體驗上的提升。
北京航空航天大學的教授吳文峻說過一個觀點,,生成式 AI 的特點就是生成,,所以不可避免會出現幻覺問題。
解決這個問題的唯一辦法,,就是需要更長的技術演進,。要用看待人類學習進化的觀點,去看待 AI 的發(fā)展,。
至少在我看來,,在微軟一騎絕塵的 AI 時代,百度能做出來,,并且敢推出這個產品,,已經是相當不易了。
首先我們要有,,這樣才能談演進,,談進化。
文章出處:差評