兩個版本都滿滿誠意,超有公升級,**不變,標準版更誠意。
目前還沒有確定中級專業版是如何定義的,希望更多的使用者能夠體驗到該產品。
4K到6K是主要價位段,使用者在不斷增長,希望在這一領域做得更紮實。
相信兩者不會對銷售產生影響,未來銷售可能會更大。
這是這次採訪中安第斯模型在OPPO Find X7 Ultra上的一些對話的總結。 1月8日,整合了雙潛望式長焦、最新旗艦晶元和OPPO自訓練多模態人工智慧模型的Find X7系列在深圳正式向公眾亮相。
作為一款在動態影像、大型模型互動落地等很多方面都頗具趣味性的產品,相信很多人都和我一樣,對它有很多疑問和好奇。 發布會結束後,我們也有幸採訪到了OPPO首席產品官劉作虎、影像產品總監張璿、軟體創新中心總經理張軍。 雙方就產品定位、OPPO形象主張、AIGC的現狀和未來等進行了深入交流。
以下是採訪的精選內容。
Q:這次Find X7兩款機型,**差距比較大,中間怎麼補?
劉作虎:你應該感覺到了,我們兩個版本都充滿了誠意,我們的ultra已經公升級了,但是**和之前沒什麼變化,標準版比以前更誠懇了,我們真的沒想過怎麼做中間的pro,我們也知道當初X6的時候,X6 Pro被定義為形象旗艦,在X7中,我們還是這樣定位的,不斷新增,新增之後才發現超的定義才是代表巔峰的旗艦。
下面還是有目的的,希望能讓更多的使用者體驗到,不然這麼多好功能會被上百萬人使用,未來還會有上千萬人使用這個產品嗎?我們發現4k到6k這個價位是乙個非常主力的價位段,而且這個細分的使用者在不斷增長,所以我們希望在這個領域做得更紮實,讓更多的人能用到,所以這次我們會做足足的誠意,至於未來中期怎麼補, 然後當我們思考如何定義產品時,再填進去,反正一是做到最好,二是讓更多的人體驗,然後把兩個極端都做好。實際上,我不認為這兩個對銷售有任何影響,也許比以前銷售的要大。
問:皮特,你能解釋一下為什麼你還沒有弄清楚怎麼做嗎?因為這一代的標準版基本上和上一代的pro非常接近。
劉作虎:當然,和別人的Pro相比,別人的Pro還不如我們的標準版,所以要超越Pro,我就用Pro產品,但是標準版**的定義無非是讓更多的人使用。 這確實使在中間定義專業人士變得更加困難,因為我已經將專業人士交給了所有人。
Q:從需求的配置來看,這次標準版的畫面、音訊、畫面都存在一些差異難道是他故意給職業選手留出位置嗎?
劉作虎:沒有刻意,超標準版已經是超專業版了。
問:關於今天 Find X7 系列軟體的進展,未來會委託給舊型號嗎?
張璿:我們已經在做這個了,這裡面有一些下沉的部分,我們稍後會為大家推出乙個計畫,我們需要把這套框架做得比較穩定,然後對舊的平台和硬體做一些適配,這樣會比較容易。
Q:兩代Find Imaging都非常重視色調和美學,但有些東西是普通使用者可能無法欣賞的,包括一些個別場景的色調不是那麼通用。 在正確的審美和大眾認知之間,OPPO如何看待這件事?
張軒:這件事情還真沒那麼複雜,我們從來不想教育大眾,語氣也不是我們發明的,這兩年在交流上出現了一點點疏離,語氣好像成了某種風格,語氣等於高對比度、高亮度。 影色調這個詞可能伴隨著攝影,我們把影色調看作是光影,去掉顏色後,光影在整個畫面中的分布,本質上不是一種風格化,影色調是攝影比較重要的地方。
我們做色調,不是強調色調,在攝影中一定要把握攝影的本質,這個本質是指當我們掌握了一些基本的能力,我們可以幫助使用者創作得更好,所以色調就會被提及,對於大眾來說,真的沒有必要去了解色調這個詞是什麼, 或者說中間的基調是什麼,最直觀的感覺是大眾拍手。
我給大家舉個真實的例子,昨天我請了幾個朋友吃飯,他們問我在做什麼,我說這兩天我發布了新產品,他們問和以前的產品有什麼不同這個不好說,也談不上色調和中間色調,所以我說就拍幾張人像,拍完後給他們看,他們看完後的第一反應是“你給我修圖了嗎?,我覺得這是普通人認為好做的事。
在影片基調及相關部分的背後,我們踐行著OPPO“輕鬆捕捉生活之美”的理念,什麼是輕鬆捕捉?使用者點選快門,這很好。 生活的美好在於使用者在日常生活中拍攝的場景,使用者不需要去想它應該是什麼樣子。 當事情被拍攝時,使用者會想,“你幫我修好了嗎?這是一種非常高階的審美,但這種高階的審美並沒有嚴格區分低階的,相信使用者看完還是覺得不錯。 如果我們真的想做一些需要很好地教育使用者的東西,那可能是我們錯了,我認為這是它的核心。 我相信這一點,我們要相信大眾的眼光和改變。
上個月,我們也在內部分享,比如我們曾經說過,韓劇的光影很好,電視劇集也很亮,但是在Netflix進入南韓之後,韓劇又進入了另乙個階段,比如我們看了《黑暗榮耀》,我們十幾年前就看了《浪漫滿屋》, 電影的色調,色彩,Netflix的電視劇集和電影很像,很大一部分是電影調整體的進步和認識的改變,我們不得不相信大眾的審美,但是我們通過技術手段去體會大眾想要什麼,我覺得色調是沒有程式化的。
Q:2024年OPPO發布了連續換光技術,為什麼這次Find X7 Ultra選擇了雙潛望鏡方式,而不是採用連續換光方式?
張璿:很簡單,連續變光底部的尺寸會很小,當時底部接近1 4左右,但是在做連續變光的時候,連續變光的本質是保證畫質部分的中焦距,但是尺寸非常大, 甚至連連續光變化的大小都比現在使用的1 1還要多56中焦潛望鏡的尺寸更大。 連續變光是一種技術方式,使用者最終買的不是技術,使用者買的是解決問題的方法,最終比較的邏輯很簡單,在尺寸鏈的可靠性、演算法和最終效果角度上,哪種方案可以覆蓋使用者常用焦距的影象質量, 這是先決條件。
二是連續的光線變化看起來像是縮小成乙個模組,但是存在乙個問題,比如這次看6倍的人像很有表現力,本質上我們有乙個最強大的中焦作為景深和散景裁剪,如果沒有中焦兩個攝像頭配合的話, 6倍人像拍攝,散景不會做得太好,因為景深需要計算,如果做成連續的光線變化,會加強光學特性,但有可能從畫質和基於演算法的環節來看,並不是最合理的。
這也是之前很多**問過的,為什麼不把它做成光學,不是說做不成光學,而是現在的手機影象在計算影象時是平台算力、演算法和模組的結合,不容易回到原來相機的邏輯,否則就會在手機中出現很多功能和用途, 而且在經驗維度上,可能沒有大家想象的那麼好。
Q:從**鏈的訊息來看,朋友們跟進了雙潛望鏡的計畫,可能要等到明年,對於OPPO來說,這也是乙個非常好的時間視窗,我想問大家在雙潛望鏡的配置上,你覺得明年,你還能引領哪些方向呢?或者你能發出一些通知,你接下來要做什麼?
張軒:我最大的體會就是做不到通知,能夠給大家提供很多資訊非常重要,總的來說,我們在做雙潛望鏡的時候,有人問雙潛望鏡有什麼難點,是不是把兩個潛望鏡放進去,乙個潛望鏡確實不難, 甚至去年的中郊潛望鏡,似乎也有朋友用過我們的解決方案,但絕對不是我們的OEM。
我們說映象是系統級的方案,從X6、N3到X7,OPPO形象內部最大的變化就是我們會系統地考慮問題,是乙個完整的方案,涉及到什麼鏈條,在什麼情況下以什麼形式暴露產品,以及曝光的那一刻,使用者覺得產品的滿意度就足夠了,而不是成為一種技術宣洩,如果只是在PPT中技術不能反饋到產業鏈上,這也是一種浪費。
雙潛望鏡的技術難度非常大,我們做完中焦外底之後,雖然X6上市後大家都說為什麼中焦做潛望鏡呢?據估計,下乙個超大罩杯,業內估計中焦點是外底。 一項技術是否領先並不是乙個絕對的技術指標,首先是看市場反饋如何,其次是朋友是否和他們在一起,什麼時候跟他們走,如果一件事情很厲害,朋友不跟它在一起,一般就沒有那麼厲害了。
當我們衡量的時候,使用者價值是一,除了從技術領先的角度,還是看多久,朋友能做到類似的表現力,在雙潛望鏡的視角下,朋友是不會跟上的,我們在整個系統框架下,再想想形象應該是什麼樣子,使用者想要什麼, 朋友是否跟進,其實我們認為並沒有那麼關鍵,如果朋友明年的生意走出雙潛望鏡,相信當時的技術會比今年更進一步。
Q:既然我們的手機刻意強調攝像頭,那麼和iPhone相比,我們能拿到多少分呢?
張璿:不知道你上次是不是來海口了**,我當時在PPT上寫過,我們是iPhone的學徒**,這個可不謙虛,其實我們發現和iPhone的差距很大,相信你在這裡一定也有同樣的問題。
劉作虎:所以如果業內有人說他的**和iPhone的水平一樣,那你就知道他是在吹牛,不靠譜。
張璿:所以我們這一代人做晶元的時候,尤其是MTK在合作,包括我們做晶元,開啟它,其實很大程度上,對你們的軟硬體核心計算要求很高,尤其是功耗能力,你會發現蘋果的功耗非常可怕,可怕到蘋果執行指標最高, 比如4K60幀HDR,可能比廠商不執行4K60的功耗還要低,這個根本玩不出來吧?
拆開之後,你會發現這個缺口是沒有去想那些有它的人,我們當時說,你想拿出一些功能嗎?雖然我們看似在發布會上用蘋果作為PK,但我們心裡很清楚,很長一段時間,這肯定還是乙個學習的過程,所以今年我們做**的時候,在做產品規劃的時候,就定了幾個月,我說不用做什麼怪異的**功能, 而你想要的第乙個問題**是**我能非常穩定地連續拍攝嗎?
我們先來看看這一點,所以我們在今年的**發布會上沒有談到任何新功能,這有點像我們去年做相機的第一年,我們沒有做任何新功能,所以我們只是為舊功能做了新的,所以今年的**希望能得到大家的評價。 我們認為,如果把蘋果的**看成100分,我覺得我們今年結束後會在80-82分的範圍內,我覺得應該是這樣的。
劉作虎:我補充一點,**這塊,我覺得我們當下應該明白方向還是對的,剛才張軒也說了,我們和iPhone相比,我覺得整個Android和iPhone,不是點差問題,而是系統性問題。因此,讓我們回到系統性解決方案,而不是說我今天的觀點在特定情況下似乎非常好。
所以**這個方向,我覺得安卓廠商這幾年的理解是錯誤的,我覺得我們現在至少是朝著乙個正確的方向走的,但是這條路還是比較長的,就是先怎麼讓它穩定拍攝,這並不容易,而且它的很多演算法和我們現在在拍照上做的完全不一樣,不斷新增一些演算法,讓區域性場景做好,這個想法就完全不同了。
張璿:是的。 我們今年的目標是讓大家在拍攝時感覺和iPhone非常相似,但是如果你仔細地把它放到一些極端的場景中,你可能還是能發現我們不如iPhone的地方,我覺得這能得到你的反饋,對我們來說改進是非常重要的。
劉作虎:今年我們支援全焦距的4K HDR,iPhone什麼時候已經上市了?但其實就算你做到了,這個(多攝像頭)的一致性,我覺得也是很有挑戰性的,但這是乙個長期的過程,比如今天的iphone**是100分,我們現在是70分,明天我們做80分,後天85分,我覺得這已經不錯了,但是我拍的照片真的很棒, 右?
Q:剪髮效果感覺很好,不知道能不能透露一下演算法邏輯是什麼?從外觀上看,看起來不像是一根一根拔出一根頭髮,而更像是AI還原了一部分頭髮。
張璿:AIGC部分我們還沒有做,但是我們可以用AIGC的方式做一些場景,以達到更好的效果,對於我們的演算法來說,這個事情已經做了。 但我們正在做這兩條線的邏輯。 老師,你現在得到的頭髮級散景,確實是基於我們的AI深度遮罩這種方式,我們用更多的計算來處理它,但是AIGC未來能不能生成一些方法,試圖讓它看起來更真實,問題的可控性還是需要考慮的。
今年,在我們的專案中,景深資訊將更加準確。 對於被攝體的識別部分,對於某些特徵,比如蓬鬆物體的邊緣,尤其是大模型之後,相機在區域性側的演算法可以產生非常積極的效果。 經過大家的反饋,目前的解決方案還是需要細化的,還沒有達到100%的,每次都能達到最佳狀態,但這個方向會繼續迭代。
業內也有一些人是用類似的方式去做的,在一些場景下可以取得不錯的效果,這也是乙個不錯的技術方向。 但是,當我們與AIGC討論時,我們在今年和明年的產品中設定了乙個基本原則,即用相機拍攝時,我們應該捕捉生活的美好,並且應該以使用者的實際資訊為條件。 當然,當使用者在相簿中進行編輯時,是否有可能將其的整個生成或範圍放大,以便客戶可以自由選擇相簿的部分。 但是,目前這些可能會篡改相機端的某些資訊,導致使用者覺得**資訊和預期拍攝的資訊有問題。
在一些準確的地方,比如拍攝文字,一定要把文字拍得很清楚,不需要猜測文字。 如果牆上沒有文字,生成一段文字還是比較謹慎的。 因此,我們更願意把它放在後端作為功能的補充,比如擦除、模糊等處理功能可以基於原始影象進行處理。 隨著技術的發展,相信相機的特性會得到反饋和改進。
張軍:我想在宣宮的基礎上補充一點。 當前的剪下功能不使用生成功能。 那為什麼頭髮選得這麼好呢?還是基於我們三年來積累的肖像和動物資料。 您看到的 AIGC 消除了該函式的背景,以補充生成部分,這是使用生成功能完成的。
Q:關於AIGC淘汰的部分,隨著AI的發展和算力的提公升,AI效應被搶占只是時間問題,OPPO將如何應對這個問題?
張璿:我們一周前在技術內部有過一次討論,我們稱之為原產地保護,大家開始對這個過程提出異議,由工程師發起,我們發現演算法進入邊界後,相機拍攝的資訊並不真實,比如拍月球,只要能幫使用者拍出想象中的**, 真實性從何而來?我需要備份原始影象嗎?這是保護原產地的邏輯,這是乙個很好的輸入,當我們回過頭來時,基於整個公司形象的AIGC,包括我們公司的道德部分,將受到統一控制。
張軍:我繼續講宣宮的話。 是的,我們的想法是一樣的,從AI的角度來看,這是乙個非常有趣的話題,AI本身就有大量的生成能力是可以替代的,在一段時間內,我們內部已經討論了很長時間,我們希望能把這種AI能力作為使用者的工具, 幫他,協助,把意志留給使用者自己,所以在一段時間內,我們不想直接替換這個東西,從人性的角度來看,也許不一定是使用者真正想要的,當然,從大資料的角度來看,技術上是可行的,但從倫理和經驗的角度來看, 我們都希望在一段時間內被定位為AI輔助幫助工具。
Q:今天的大模型演示非常精彩,我更關心的是它的總結和生成內容的準確性是否有一些具體資料可以分享,包括模型幻覺的情況?
張軍:我們評價大模型的效果有幾個方面:一是準確性,二是完整性,尤其是對於彙總等功能,然後是資訊細節的反映,以及一些負面指標,可能是對彙總模型的充分評價。
在這個模型上,我們對通話總結功能做了大量的競爭性綜合評估,可以負責任地說,我們是所有總分中最好的。 另一方面,我們經常被問到,比如呼叫總結已經做了70億大模型,很多人問為什麼選擇70億,為什麼不用10億其實我們在上一次產品技術交流會上已經展示了對比,我們會針對每個場景選擇最合適的引數尺度,代表這個場景下模型的智慧型化,我們也會選擇最合適、最智慧型的模型來做最合適的場景。 事實證明,在新模型上,我們在呼叫摘要函式的假設方面與競品相比更好,包括摘要的準確性、關鍵資訊提取的完善性以及細節提取的準確性。
問:這一次,在乙個產品線中,天璣和高通都使用了,並且兩款產品都推出了大量功能。 這有什麼技術困難嗎?或者你感覺如何?尤其是在AI方面對NPU要求比較高的場景下。
劉作虎:唯一的事情就是增加資源,確實,你說得很對,同時做兩個平台很有挑戰性,這個只能加。
問:AI 是否考慮過本地化部署?
張軍:是的,這個 X7 本身會在端側部署乙個 70 億引數的大語言模型,視覺模型也會部署在端側,它會在我們的 OTA 後面推出。 我們也看到,70億引數的大模型真的同時部署在了兩大晶元平台的端側,OPPO也可能是第乙個真正應用的。
Q:我想問乙個關於潮汐架構的問題,現在潮汐架構在整體效率表現上真的很好,它和硬體之間有很強的繫結關係嗎?比如已經發布的Find X6後期能用嗎?還是未來會推出的非旗艦產品或中高階平台?
劉作虎:我的回答不一定準確,這一代推出的潮汐架構是和平台廠商深度定製的,當然不是隨便移植到其他產品上,這是我們做的一套潮汐架構,如果以後想在哪個平台上做這個,可以用類似的方法去做, 但今天不是直接拿到這個演算法OTA,我明白應該是這樣的,我不專業,別誤會。
Q:這次潮汐架構顯然會主動保持CPU核心盡可能的節能,在一些主流的測試軟體中,尤其是純CPU測試中,對效能有一些負面影響,不會跑得那麼高,但相比之下,比如realme等品牌都定位於形象旗艦機上, 今年在效能上更加激進,OPPO如何才能讓消費者相信潮汐架構在效能上有了很大的提公升?
劉作虎:雖然我們在今天的發布會上談了很多榜單,但這只是乙個認可,讓大家知道我還是有實力的,不管我怎麼做,或者對使用者有什麼體驗,在一些跑步得分上可能都不是很高,這不是第一名, 或者這取決於你想要什麼。
我覺得這一代人的流利度很好,為什麼會有這個問題?以前,軟體團隊沒有做好自己的工作,發布的bug很多,金額非常大,卻被罵到天上,名聲翻不過去。 其實這一代我自己用過,流暢度非常好,比前幾代有很大的進步,肯定包括一些需要優化的地方,我覺得整個提公升非常明顯。 我為什麼要講這個例子?雖然潮汐架構是一項技術,但到底還是在不斷的詢問研發團隊如何讓它更流暢,讓它體驗更無負擔,這就是我們所追求的,不知道你在低分榜上說的是什麼。 對於你的使用者定位,你的具體體驗是什麼,每個家庭都會有一些不同的選擇,我只能這樣說。