大家好,我是米羅,,現(xiàn)在正蹲在谷歌園區(qū)旁邊的汽車旅館里給你們通宵碼稿子,。
除了昨天上午公開的直播現(xiàn)場之外,,今天和昨天下午谷歌還辦了幾場媒體座談,,聽到了點兒更有意思的東西,,所以發(fā)稿耽誤了,。
絕對不是因為搶自拍位耽誤了,,甚至拍糊了。甜美的,。
OK,,廢話結束,我們言歸正傳~
這個時候,,我猜可能大家已經(jīng)看了不少 Google I/O 大會相關的報道了,。
所以流水賬式的東西我就不講了,稍微跟大家聊點偏幕后向的東西吧,。
首先,。我們簡單看一眼硬件產(chǎn)品,估計大家已經(jīng)跟酷安老哥們一起,,笑話完“3500元以內最好的拍照手機” Pixel 7a 了,。
也吐槽過“市面上最薄的折疊屏手機” Pixel Fold 了。
這玩意我在后臺上手了一下,。
真機意外的薄,,比 PPT 上面要好看不少。
但是你要跟我說它值一萬二,,抱歉,,國內比它好的折疊屏太多了,我對這玩意完全無感,。
還是看看遠方的華為吧,,家人們~
我這么跟大家說吧,這屆 I/O 上,,跟手機相關的東西基本上都沒什么看頭:
新的 Pixel 平板還算有點兒意思,,但是顯然它的產(chǎn)品經(jīng)理是奔著家具擺件的方向去做這款平板的。
假如家里沒什么谷歌系的智能家居,,可能體會不到這個平板的“爽點”,。
年更節(jié)目 Android 14 也幾乎沒啥人關注。
第二天媒體會上還介紹了一個安卓上很重磅的,、“練習時長四年半”的功能,。
結果我一看演示就樂了:同樣的技術華為半年前就做出來了,效果還更好,。
不過這個功能還在媒體保密期,,這篇文章里沒法展開跟大家吐槽了。
目前為止小伙伴們應該發(fā)現(xiàn)了,我已經(jīng)花幾百字吐槽 Google I/O 了,。
那為啥我標題里面還覺得它不錯呢,?
因為 AI 。
在“保有道德感”的前提下,,谷歌把所有能整合 AI 的產(chǎn)品,,全都揉上了 AI ,試圖錘爆一切同行,。
人在現(xiàn)場,,非常受震撼。
我先跟大家從一個小功能講起吧,。
在谷歌 Pixel 手機上拍完一張照片之后,,假如對當時的天氣不滿意,可以通過 AI “魔法換天”,。
也可以用 AI 消除風景照當中無意拍到的路人,。
看到這兩個功能之后估計很多小伙伴都笑了——華米 OV 早就把這倆功能做到相冊 App 里了好吧!
但是下面這個呢,?
“假如你給女兒拍完照之后,,覺得畫面比例不太好,想把她放到畫面正中間,。 ”
“直接拖拽就好了,, AI 會幫你憑空補全不存在的信息。 ”
我擦,。
同時谷歌地圖中推出了一種全新的“沉浸導航”模式,。
比如我今天想騎車出門,谷歌地圖能通過街景車拍攝到的信息,,生成一幅行進道路上的 3D 全息圖,。
哪里是大太陽暴曬、哪里是樹蔭,、過馬路的時候斑馬線寬不寬,,全都看的一清二楚。
而且還加入了模擬天氣動畫,,看地圖的時候就把天氣預報給看了,。
總之非常炫酷,建議高德百度搞快點,!
此外,,谷歌辦公套件的 Slides (幻燈片)里也加入了類似 midjourney 那樣的 AI 圖片生成器。
以后做 PPT 的時候不用上網(wǎng)搜圖了,,直接告訴 AI 幾秒就能生成出來,,還沒版權風險,。
生成圖片:披薩沾火鍋
但是,以上這些功能肯定是不夠重磅的:
酷歸酷,,但“壁壘”沒那么高,。
友商們真要想“致敬”的話,,小米華為,、高德百度、阿里訊飛,??隙ò肽陜饶芨愠鰜韨€七七八八的。
谷歌這回真正有壁壘的,,是發(fā)布了全新一代語言模型——PaLM 2 ,!
就好像現(xiàn)在汽車廠商們會研發(fā)一款模塊化底盤給很多款車用一樣, PaLM 2 就是谷歌的“模塊式” AI 底盤,。
舉個例子,,谷歌在發(fā)布會上把 PaLM 2 砍了幾刀,分出了具體四種規(guī)模的 PaLM 2 模型,。
規(guī)模最小,、最精簡的叫 PaLM 2 Gecko (壁虎),小到手機上的 NPU 就可以運行,。
最大規(guī)模的則叫 PaLM 2 Unicorn (獨角獸),,具體規(guī)模沒有透露,用來部署在谷歌自研的 TPU v4 集群上,。
我嚴重懷疑,,獨角獸的規(guī)模可以隨著硬件規(guī)模的擴大而持續(xù)擴大,。
不過這點暫時存疑,,谷歌也沒公布 PaLM 2 的具體參數(shù)規(guī)模。
這么做的好處顯而易見:開發(fā)人員只需要做一款 AI 模型,,再通過不同程度的精簡就可以滿足小到手機離線翻譯,、語音助手,大到 ChatGPT 那樣的高強度邏輯對話,、文本分析,,省時省力。
但除了這點之外,,谷歌還給 PaLM 2 丟了一招更狠的:
除了預設的四種大小模型之外,, PaLM 2 還支持拿特定信息進行“精調”,生成“自定義 PaLM”,。
比如谷歌拿安全知識和病毒數(shù)據(jù)喂給 PaLM 2 ,,由此產(chǎn)生了一個新的 AI 模型“Sec-PaLM”,,據(jù)說已經(jīng)放進了 Gmail 的服務器幫用戶掃描附件病毒了。
谷歌還拿醫(yī)學知識訓練了一個“Med-PaLM 2”,,能夠看懂 X 光片,,提供就診建議。
并且基于谷歌的對比測試,,以前同類 AI 只是“醫(yī)師執(zhí)照考試及格”的水平,,這次的 Med-PaLM 2 卻是頂尖專家的水平。
以上這兩個,,只是谷歌自己的精調例子,。
更好玩的還在后面,谷歌馬上還要把“精調 PaLM 2”服務放在 Google Cloud 上面公開出售,!
個性化大模型,。前兩天國內廠的兄弟剛跟我講完這個未來式暢享,谷歌這個月就把事給辦了,。
我簡單舉這么個例子:以后要是我想摸魚,,讓 AI 模仿我的文風寫稿子。
那我完全可以直接去谷歌買一個“精調資源包”,,然后把我以前寫過的所有文章作為訓練素材喂給我買的小 PaLM 2 模型,。
然后,我就能得到一個“米羅-PaLM”了,。
假如一切順利的話,,它生成的稿子用來騙總編完全不成問題。
我直接開玩,。
而且因為谷歌在訓練 PaLM 2 的過程中使用了幾百種語言的語聊數(shù)據(jù),、也喂進去了幾十種編程語言的代碼資料。
這貨在設計之初,,就是奔著AI 界的語言大師去的,。
為了驗證這玩意的語言水平,劈柴哥現(xiàn)場搞了兩個例子:
首先讓 PaLM 2 給一段代碼找 bug ,。
找完之后還要讓 PaLM 2 再用韓語給整段代碼做一遍注釋,。
熟練吧,但要說樂子還得是下一個:
讓 PaLM 2 幫你跟缺德航司對線:比如某天你的航班被取消了,,航空公司表示十分抱歉,,然后發(fā)了個等價兌換券過來。
退款,?我都給你代金券了,,你還想要退款?遇到這種情況,,肯定就得跟航空公司寫郵件去慢慢掰扯了,。
但是以后,,這樣的郵件你可以讓集成了 PaLM 2 的 Gmail 郵箱幫你寫!
你甚至可以指定 AI 寫作的語氣,。
比如你可以讓 AI 的“說教”意味更濃一些,,重新生成的郵件里就會多一段“我可是你們老客戶啊你們怎么敢這么對我?”
不知道以后航空公司會不會也拿 AI 回郵件,,此番美景我愿稱之為新時代的賽博對線,。
前面我們提了一嘴, PaLM 2 是谷歌有史以來最懂多語言的 AI 模型,。
所以在 PaLM 2 發(fā)布,、并且劈柴哥宣布 Bard 正式切換到 PaLM 2 模型后,,下一條消息就是:
Bard 將會開放日語和韓語模式,。
啥?日語韓語都有你居然能沒世界第一大母語,?
于是在媒體問答環(huán)節(jié),,同行的媒體老師就把這事給問了。
谷歌的答復非常典:“不調好,,不發(fā)布,。 ”
在奇怪的地方有了點兒國產(chǎn)手機廠商內味兒。
按照谷歌的說法,,在 Bard 正式開放日語和韓語對話之前,,美國以及當?shù)氐膱F隊已經(jīng)對 Bard 進行了很多輪測試。
只有確保 Bard 在該語言下表現(xiàn)穩(wěn)定,、不會輸出“有害信息”之后,,才會向當?shù)氐墓婇_放。
簡單點兒說谷歌要求對 AI 的落地語言進行肉測,,目前只跑完了日語和韓語的,,其他包括中文在內的所有語言都還在跑。
但我這波站谷歌,,雖然來的晚,,但總比來的水要好。
不知道小伙伴們用微軟 NewBing 的時候會不會遇到這么個略微有點兒惡心的情況:
假如它輸出的內容中出現(xiàn)了某些踩線的“敏感詞”,, NewBing 就會不分青紅皂白瞬間終止對話,。
比如前一陣的香港名媛案( details on the abby choi case ), Bard 和 NewBing 都能正確介紹事件,,兩者前幾段的表述是差不多的,。
但是 Bard 能完整介紹完整個案子,并且接受進一步的互動,。
NewBing 則是在“碎尸( body apart )”的關鍵詞出現(xiàn)后,,就會強行終止會話,,順便還把前面給我輸出的一堆東西給刪掉了。
中英文均如此,。
NewBing 的做法其實我有些不理解:你明明是照著搜索引擎里面的結果念的,,搜索引擎本身已經(jīng)有過一層安全過濾了。
你還在過濾些什么,?
這樣的情況遇到多了之后,,我就會不由自主生出兩個問題:
NewBing 這么粗暴的關鍵詞識,會不會有些懶政,?
微軟和 OpenAI 的合作,,會不會有點兒不和諧?
可是話又說回來了,,谷歌要是不管“復讀碎尸”啥的東西的話,,它“剔除的有害信息”是什么?
谷歌的答案是這樣的,。
假如你問出:為什么美國登月是假的( why the moonlanding is fake ),, Bard 會先說明“登月是真的”,然后列舉出駁斥陰謀論的內容,。
NewBing 則不會這么說,,它會先順著問題列出陰謀論中質疑登月的幾點結論。
等都說完之后再“畫風一轉”,,講上面的說法都是被證偽的,,登月是真的。
看起來,,論谷歌眼中的“有害信息”,,假新聞才是那個繞不過去的坎。
順著這條線去捋,,谷歌對假新聞的措施也算是貫穿這次 I/O 了,。
比如谷歌本身有一個用來合成聲音的 AI 模型“AudioLM”,這回它們逆向工程,,用 AudioLM 訓練了一個能夠識別 AudioLM 合成聲音的模型,。
以后谷歌還會主動給自家 AI 生成的內容打上隱水印,便于其他人辨識,。
還有,。谷歌圖片搜索功能也得到了更新,除了搜索圖片本身,,還能列出這張圖片第一次被谷歌收錄的時間節(jié)點,、以及對應的網(wǎng)站鏈接。
這個功能和 AI 關系不大,,但某種意義上來說這個升級點也是“移花接木”類假新聞的克星了,。
假如有小伙伴沒看谷歌 I/O 的,,我在這里再補一個關鍵信息:馬上谷歌搜索的結果網(wǎng)頁里,也會像現(xiàn)在微軟 NewBing 一樣,,增加類似的對話板塊了,。
這個東西看起來已經(jīng)箭在弦上了——整場活動大部分內容都是錄屏或者 PPT ,這個對話式搜索是為數(shù)不多的實機演示,。
和 NewBing 類似,,我們需要通過一層層的問答去挖掘更深的信息。
但是在這個環(huán)節(jié),,谷歌反而不怎么提 AI 模型了,,反而一直在提自家搜索結果有多準確。
我粗略統(tǒng)計了下,,公開場合的時候谷歌的小伙伴說了至少兩次“搜索算法”,,線下問答時谷歌搜索的負責人又在會議室里提了差不多五次。
前前后后大概是這么個意思:AI 只是個文字收集和處理工具,,它能正常工作的前提是搜索引擎本身能搜到有價值的東西,。
搜索引擎本身不行,,上 AI 也沒用,。
好家伙,明著暗著說 Bing 的搜索結果爛唄,?
那確實,。
之前有做搜索結果生意的小伙伴跟我聊過谷歌和 Bing 這兩個搜索引擎搜東西的區(qū)別。
簡單來說,,谷歌更看重搜索“結果的熱度,、時效與關聯(lián)度 ”;Bing 更重視結果的“權威性”,。
沒有權威鏈接背書的網(wǎng)頁很難獲得展現(xiàn),。
所以以往使用谷歌時,我們更有可能搜到很新鮮熱乎,、但來源可能是小報 or 假消息的搜索結果,。
使用 Bing 時,我們可能什么結果都搜不到,,但是靠前的網(wǎng)頁必然是權威的新聞資訊網(wǎng)站,。
在 AI 加持之前, Bing 的搜索算法我覺得是非常穩(wěn)妥的——作為萬年老二,,只要自己不翻車,,等到 Google 翻車的時候,就能跑出來摘果子,。
但是隨著谷歌的對話式 AI ——尤其在假新聞辨別方面有強化訓練,,我覺得 Bing 可以考慮優(yōu)化一下本身的搜索算法了,。
不然好不容易從谷歌手上搶過來的億點點的市場份額,夏天之前還不得全交待回去了,?
OK 小伙伴們,,以上就是我這兩天參加 Google I/O 下來的絕大部分感受了。
盡管前一陣那么多業(yè)界大牛剛集體簽了個“暫停大模型研發(fā)倡議”,,但是看起來完全沒有影響谷歌這次梭哈 AI ,。
拋開硬件不談,僅僅靠一個 PaLM 2 模型,,谷歌就把旗下幾乎所有產(chǎn)品跟 AI 扯到了一起,。
一夜之間,本來被大家認為“已經(jīng)掉隊”的谷歌,,又重新武裝到了牙齒,。
第二天下午的時候,谷歌的朋友帶我們參觀了一臺名叫 Starline 的原型機,。
因為保密的關系,,不允許我們拍照和錄像。實際上它是一臺帶全息投影功能的遠程會議終端,, 2021 年立項,,初衷是希望處在疫情中的人們依舊能夠感受面對面的交談體驗。
但——
直到兩年后的今天,,第一臺可用的 Starline 會議終端才面向媒體開放,。
我問了一下這個項目的負責人,為什么拖了這么久,,疫情都結束了,。
他告訴我:
之前的原型機需要在機身上安裝很多傳感器才能實現(xiàn)定位和全息投影效果,造價高昂,,成本不可控,。
直到最近 AI 技術的爆發(fā)才讓他們低成本實現(xiàn)全息投影成為可能,才敢拿出來展示,。
就是因為相關技術發(fā)展不到位,,一款產(chǎn)品直接延期兩年,錯過了最佳的面世時間,。
在很多我們看不見的很多地方,, AI 其實都能提供意想不到的解決方式。
這也是大家為什么紛紛選擇 “ALL in AI” 的緣故,。
回到這次的 IO 上講的東西來,,雖然目谷歌的 AI 項目還是研發(fā)和執(zhí)行的時候,還是有一點左右互搏的成分在。
比如 Bard 和即將推出的對話式搜索,,誰去誰留,、還是全都保留,谷歌的小伙伴也還沒想好,。
比如 PaLM 2 雖然統(tǒng)一了谷歌內部的語言處理項目,,但是圖像識別方面 PaLM 2 看起來不太強勢,不少圖像相關的項目還在用之前的 ALIGN ,、 Flamingo 等模型,。
但在這次 I/O 大會上,谷歌也宣布,,內部的多個 AI 團隊已經(jīng)完成了整合,,組建了全新的 DeepMind 團隊。
而新 DeepMind 團隊的下一個目標,,是研發(fā)名叫 Gemini 的下一代大模型,。
對比剛剛開始服役的 PaLM 2 , Gemini 會補齊視覺,、聽覺等多模態(tài)相關的最后一個短板,。
在谷歌內部徹底實現(xiàn)一個基礎模型供給所有語言、所有類型的 AI 項目,。
那話怎么說來著,,三流企業(yè)做產(chǎn)品,一流企業(yè)做標準,。
我很好奇再過幾年,,現(xiàn)在這些 All-in AI 的廠商們,會是一個什么樣的勢力格局,。
文章出處:差評