人妻在线无码视频,久久六月无码一区

Project Astra 關(guān)于視覺的處理甚至算整場發(fā)布會最大的亮點?！改阌浀梦野蜒劬Ψ拍牧藛幔俊埂改愕难坨R在桌子上的紅蘋果旁邊?！?/strong>Project Astra 甚至通過鏡頭記住了一閃而過的眼鏡，并準確回答出在蘋果旁。這里可能夾帶了一點「私貨」，這副眼鏡上或許也有 Project Astra。

從演示看，Project Astra 可以很快處理收到的信息，可以通過連續(xù)編碼視頻幀并將視頻和語音組合成事件時間線來做到這一點，然后緩存信息以供回憶。谷歌表示，其中一些功能將在今年晚些時候添加到 Gemini 應(yīng)用程序和其他產(chǎn)品中。

Project Astra 給這個樂隊起名為金色條紋|圖片來源：谷歌

谷歌稱 DeepMind 團隊還在研究如何最好地將多模態(tài)模型整合在一起，以及如何平衡超大型通用模型與更小、更集中的模型。

昨天剛發(fā)布 GPT-4o 的 OpenAI 最重大的突破也在多模態(tài)上，看下來似乎昨日重現(xiàn)。最大的一個區(qū)別在視覺處理上，是目前 GPT-4o 只能處理靜態(tài)圖像，Astra 已經(jīng)可以處理視頻。

Project Astra 背后的 Gemini 系列大模型能力也有更新。上個月舉辦的 Google Cloud Next 2024 大會上發(fā)布，發(fā)布的 Gemini 1.5 Pro，具有原生音頻理解、系統(tǒng)指令、JSON 模式等，可提供 100 萬長文本能力，宣布已經(jīng)向全球開發(fā)者開放。

這次宣布推出的 Gemini 1.5 Flash 模型，解決了關(guān)鍵的成本問題。Gemini 1.5 Flash 介于 Gemini 1.5 Pro 和 Gemini 1.5 Nano 之間，主要面向開發(fā)者。會上詳細介紹了 Gemini 1.5 Pro 和 Flash 的定價。Gemini 1.5 Flash 的價格定為每 100 萬個 token 35 美分，這比 GPT-4o 的每 100 萬個 token 5 美元的價格要便宜得多。

Gemini 1.5 Flash|圖片來源：極客公園

谷歌還預(yù)告了接下來的動作，宣布今年晚些時候?qū)⒛Ｐ偷默F(xiàn)有上下文窗口增加一倍，達到 200 萬個 token。這將使其能夠同時處理 2 小時的視頻、22 小時的音頻、超過 60,000 行代碼或超過 140 萬個單詞。

Gemini 1.5 Pro |圖片來源：極客公園

谷歌去年 12 月發(fā)布的一個預(yù)錄演示遭到「造假」質(zhì)疑，通過剪輯誤導(dǎo)人們高估 Gemini 的視頻處理能力，不過現(xiàn)在，這些能力都是真的了。

基于大模型的 AI 應(yīng)用生態(tài)方面的進展

在這次 I/O 大會上，谷歌基于大模型的 AI 應(yīng)用生態(tài)也有所升級，涵蓋搜索、照片、創(chuàng)作、工具以及工作應(yīng)用等方方面面。

搜索是谷歌 25 年前的創(chuàng)世產(chǎn)品。在一年前，谷歌表示，搜索的未來是 AI?，F(xiàn)在，谷歌搜索中的 AI 真的來了，主打一個——「讓谷歌幫你谷歌?！?/strong>

谷歌首席執(zhí)行官桑達爾·皮查伊（Sundar Pichai）在 I/O 大會上宣布，人工智能生成的搜索摘要，現(xiàn)在被稱為「人工智能概述」，將在「本周」向美國的所有人推出，更多國家/地區(qū)即將推出。

相比從前，AI 搜索可以處理更復(fù)雜的問題。谷歌提供了一個例子，也許用戶在尋找一個新的瑜伽工作室，要求這個工作室既要在當?shù)睾苁軞g迎，也要方便通勤，還要有折扣，只需一次搜索就能實現(xiàn)。

另外，用戶還可以調(diào)整已經(jīng)生成的 AI 摘要，或者選擇簡化版本，或者選擇查看更多細節(jié)。

這一切是谷歌通過定制的 Gemini 模型來實現(xiàn)的，其將多步推理、規(guī)劃和多模態(tài)與搜索系統(tǒng)結(jié)合，總結(jié)網(wǎng)絡(luò)內(nèi)容并展示答案，據(jù)稱還是 AI 來設(shè)計和填充結(jié)果頁面。

但一個問題是，如果是 AI 為用戶捕獲搜索結(jié)果，谷歌的競價廣告業(yè)務(wù)往哪放？

據(jù)谷歌高管稱，與傳統(tǒng)查詢出的網(wǎng)頁列表相比，AI 摘要中包含的鏈接會獲得更多點擊?！概c以往一樣，廣告將繼續(xù)出現(xiàn)在頁面的專用位置上，并通過清晰的標簽區(qū)分有機結(jié)果和贊助結(jié)果?！?/p>

除了提問，谷歌 AI 搜索還能制定計劃，從飲食到旅行計劃，比如搜索「創(chuàng)建一個容易準備的團體 3 天飲食計劃」，AI 就會定制計劃，然后用戶可以將某份晚餐調(diào)整成素食，隨后導(dǎo)出到文檔或者谷歌郵箱里。

搜索還不僅僅是文本框中的文字，谷歌的視覺搜索也進化了，可以用視頻提問。比如，用戶有臺二手唱片機，上面帶針的金屬部件漂移了，不知道怎么回事，可以直接用視頻搜索，即能得到有解決步驟的 AI 摘要和相關(guān)鏈接，省去描述問題所需要的正確術(shù)語的時間和麻煩。

使用谷歌 AI 搜索，直接制定飲食計劃｜圖片來源：谷歌

谷歌照片應(yīng)用也將進化。桑達爾·皮查伊在演示中稱，9 年前他們推出了這個應(yīng)用，現(xiàn)在每天有超過 60 億張照片和視頻被上傳到這里。

該應(yīng)用在未來幾個月將推出「詢問照片（Ask Photos）」功能，也是基于 Gemini 模型，可以讓用戶以自然語言搜索照片和視頻中的人物、寵物、地點等，它能理解照片的上下文和主題，找到特定的回憶信息，無需滑動屏幕。

例如，「向我展示我參觀過的每個國家公園的最好看的照片」「去年我在哪里露營？」「我的優(yōu)惠券什么時候到期？」「露西婭什么時候?qū)W會游泳的？」「顯示露西婭的游泳進步情況」「莉娜的生日派對是什么主題？」最后，它還能撰寫旅行亮點或者個性化的標題，供用戶在社交媒體上分享。

谷歌還稱，「除非在極少數(shù)情況下是為了解決虐待或傷害問題，我們不會使用這些個人數(shù)據(jù)訓練 Google Photos 之外的任何生成式 AI 產(chǎn)品，包括其他 Gemini 模型和產(chǎn)品?！?/p>

使用詢問照片功能，詢問生日派對細節(jié)｜圖片來源：谷歌

在創(chuàng)作工具方面，谷歌在 I/O 大會上還推出了 AI 生成視頻的工具 VideoFX，并更新了 AI 圖像和 AI 音樂創(chuàng)作工具 ImageFX 和 MusicFX。

VideoFX 可以讓電影制作人編寫提示來構(gòu)建電影鏡頭，ImageFX 添加了圖像編輯控件，而 MusicFX 出了一個新的 DJ 模式。

其中，新工具 VideoFX 由 Veo 提供動力，Veo 是谷歌 DeepMind 最強的生成式視頻模型。這個新工具配備了一個故事板模式，可以逐個場景地進行迭代，并向最終視頻添加音樂。

據(jù)谷歌高管稱，Veo 能理解「延時拍攝」等電影術(shù)語，可以生成各種電影和視覺風格的 1080p 分辨率視頻，時間還可以超過一分鐘。Veo 將通過候補名單提供預(yù)覽版。

另外值得注意的是，VideoFX、ImageFX 和 MusicFX 生成的所有內(nèi)容都被數(shù)字水印 SynthID 標記，主要是為了防止 AI 內(nèi)容濫用和虛假信息傳播問題。

使用谷歌 AI 生成視頻工具 VideoFX ｜圖片來源：谷歌

除了創(chuàng)作工具，谷歌日常工作應(yīng)用的進化也值得關(guān)注。包括 Gmail 郵箱、日歷、文檔、表格、幻燈片、云端硬盤等在內(nèi)谷歌 Workspace 應(yīng)用，將引入最新的 AI 模型 Gemini 1.5 Pro，位于側(cè)邊欄，作為一個虛擬助手。

當用戶點擊側(cè)邊欄的 Gemini 圖標時，Gmail 中的 Gemini 將提供「總結(jié)此電子郵件」「列出下一步操作」「建議回復(fù)」等選項。用戶可以讓它總結(jié)小孩學校的郵件，獲得需要行動的信息，起草回復(fù)。

Gmail 側(cè)面板中的 Gemini 總結(jié)電子郵件｜圖片來源：谷歌

另外，在昨天 OpenAI 發(fā)布的 GPT-4o 演示中，其中有個教育場景，GPT-4o 直接化身家教，逐步教一個青少年解決幾何數(shù)學問題。

谷歌也宣布推出 LearnLM，這是一組基于 Gemini 的微調(diào)模型，專為學習教育而設(shè)計，同時演示了一些在搜索、YouTube 應(yīng)用上的 AI 教育學習場景。

比如，在 YouTube 上，用戶可以在觀看視頻時提問，也可以針對視頻提后續(xù)問題。在 Android 上，可以用畫圈搜索（Circle to Search）嘗試解決數(shù)學和物理題目里的特定困難。

針對 YouTube 學習視頻進行提問｜圖片來源：谷歌

在這場 AI 公司的軍備競賽中，谷歌追趕 OpenAI 的其中一大優(yōu)勢「老本」，在于其掌握手機安卓系統(tǒng)，以及龐大的應(yīng)用生態(tài)。

但當生成式 AI 真的全方位進入谷歌的生態(tài)應(yīng)用，直接接管搜索，幫人回憶過去，制定出行計劃，取代真人家教等等，其準確性是否真的可靠？我們拭目以待。

基于大模型的 AI 應(yīng)用生態(tài)方面的進展

敬原創(chuàng)，有鈦度，得贊賞

敬原創(chuàng)，有鈦度，得贊賞