<delect id="rljdd"><span id="rljdd"><sub id="rljdd"></sub></span></delect>

      <rp id="rljdd"><i id="rljdd"><output id="rljdd"></output></i></rp><nobr id="rljdd"><th id="rljdd"></th></nobr>
      <big id="rljdd"><meter id="rljdd"></meter></big>

      <em id="rljdd"><i id="rljdd"></i></em>
        <em id="rljdd"></em><dfn id="rljdd"><i id="rljdd"><form id="rljdd"></form></i></dfn>
            <big id="rljdd"><noframes id="rljdd">
                <meter id="rljdd"></meter>
                  <meter id="rljdd"></meter>

                    登錄甲子光年
                    其他登錄方式
                    登錄即表示你已閱讀并同意
                    《甲子光年用戶注冊協議隱私政策
                    找回密碼
                    獲取驗證碼
                    注冊甲子光年
                    獲取驗證碼
                    注冊即表示你已閱讀并同意
                    《甲子光年用戶注冊協議隱私政策
                    綁定手機號
                    獲取驗證碼
                    登錄即表示你已閱讀并同意
                    《甲子光年用戶注冊協議隱私政策
                    完善資料
                    登錄即表示你已閱讀并同意
                    《甲子光年用戶注冊協議隱私政策
                    微信登錄
                    掃描二維碼 | 授權登錄甲子光年
                    甲小姐對話Serge Belongie:送你一顆可證偽性的“子彈”
                    作者:張一甲 2024-07-31

                    可證偽性是天使也是魔鬼,歸根結底,可證偽性是一個世界對齊的握手機會。


                    作者|張一甲 蘇霍伊


                    十年前,一位歐洲院士對我說:“人工智能有不下百個細分賽道,美國會定義一到兩個流行賽道,而后全球創業者投資人一哄而上去追趕這一兩個賽道?!?/span>

                    此后十年風口輪轉,人工智能從非共識到小共識,從小共識到大共識,卻從未跳出這句話。

                    這次對話Serge,始于對他兩年前參與撰寫的論文《尋找不可證偽聲明中的結構》的興趣。只可惜這篇文章至今幾乎無人問津,Google Scholar引用量只有2次。

                    這讓人驚訝。

                    「甲子光年」認為,這篇論文被嚴重低估了。

                    理由一,這篇文章面對的問題極其關鍵(社交媒體不可證偽性數據的潛在敘事);

                    理由二,這篇文章給出了重要的理論創新(三元標注法與SNaCK集合);

                    理由三,這篇文章給出了工程上的實踐成果(數據集構建與詳實實驗比對)。

                    論文作者Peter Ebert Christensen、Frederik Warburg、Menglin Jia和Serge Belongie;ARXIV2022

                    這篇論文不難理解,我們從可證偽性這個概念開始介紹。

                    可證偽性(falsifiability)又稱可反駁性(refutability)??茖W哲學往往使用嚴格的證偽法來判別一個理論是否科學,即“這些結論必須容許邏輯上的反例的存在”。

                    卡爾·波普爾在1934年提出,如果一個理論或假設可以被現有技術的實證檢驗在邏輯上抵觸,那么它就是可證偽的。而如果一個表達無懈可擊,以至于讓世界沒有置喙余地,那往往只能讓所有人敬而遠之,對推動科學進展無益。

                    科學家們能夠或應該研究的問題,或多或少要有罩門,即讓別人有機會攻擊甚至推翻??勺C偽性的目的,是使理論具有預測性和可測試性,從而在實踐中有用。

                    Serge的論文《尋找不可證偽聲明中的結構》探討了社交媒體上不可證偽聲明的解讀復雜性。

                    論文大意:

                    社交媒體平臺充斥著大量帖子和評論,許多主張無法被證偽。然而,事實核查工具不足、社交網絡討論缺乏結構、敘事識別存在困難、公共討論缺乏質量等,造成諸多困擾。

                    論文研究了如何在社交媒體上識別和理解那些無法被證偽的主張(unfalsifiable claims),并將這些主張歸納為有限幾種敘事(narratives),以便更好地促進社交媒體上的討論和辯論。

                    有趣的是,作者構建了一個名為PAPYER的數據集,包含針對公共洗手間的干手方式(紙巾與空氣干燥器)的辯論,600個短文本摘錄,31種敘事,4個超級類別,以理解和發現在線討論中的主流敘事。

                    該論文引入了一種超越現有事實核查技術能力的新方法,為管理和理解數字通信環境中不可證偽聲明的影響提供了重要貢獻——使用這個流程可以發現主流敘事,并且表明這個流程的表現超過了最近的大尺寸變換模型和最先進的無監督主題模型。

                    通過實驗,作者發現使用現代句子轉換器(如T5模型)進行初始句子嵌入是關鍵。他們還發現,采樣策略對于生成高質量的嵌入至關重要,特別是“Distance-Rnd”策略表現最佳。

                    實驗結果表明,結合人類注釋的三元組(triplets)可以揭示遵守結晶敘事的有趣聚類。

                    僅2次引用

                    「甲子光年」認為,這篇論文在業界至今缺乏關注的可能原因包括不限于:

                    (1)理論分析相對單薄,實驗結果分析停留于定性(11頁正文僅半頁公式);

                    (2)對于用來做對比的幾個算法幾乎沒有展開介紹;

                    (3)該領域可能還沒有學術界統一的數據集,導致在學術界內部沒有“出圈”;

                    (4)筆者強調了T5的關鍵性,但沒有敘述清晰其算法優越性。

                    Serge Belongie在CVPR2024的學術分享,來源:「甲子光年」拍攝

                    雖然上述論文鮮為人知,但Serge本人是計算機視覺和機器學習領域極具影響力的科學家,主要研究對象識別和圖像分割,截至目前,他各類論文被引用次數達到17.9萬次。

                    Serge Belongie,哥本哈根大學(University of Copenhagen)計算機學教授、丹麥人工智能先鋒中心(The Danish Pioneer Centre for Artificial Intelligence)主任。此前,他曾任康奈爾科技學院副院長和Andrew H.和Ann R. Tisch計算機科學教授。

                    最值得介紹的是,Serge是MSCOCO的主要作者。

                    MSCOCO數據集是最著名的計算機視覺大規模數據集之一。2000年,Serge與Jitendra Malik(現加州大學伯克利分校計算機科學系教授,計算機視覺領域著名學者)共同提出了“形狀上下文”(Shape Context)概念,是計算機視覺和對象識別領域應用十分廣泛的形狀特征描述方法。

                    2004年,Serge被《麻省理工學院技術評論》評為35歲以下的青年科技創新者;2007年,他和Jitendra Malik獲得了馬爾獎榮譽提名;2015年,Serge獲得了ICCV亥姆霍茲獎,該獎項主要頒發給在計算機視覺領域做出根本性貢獻的論文作者。

                    Serge還是多家公司的聯合創始人,包括 Digital Persona(2014 年與 CrossMatch 合并)、CarCode(被 Transport Data Systems 收購)、Anchovi Labs(2012 年被 Dropbox 收購)和 Orpix。

                    目前,Serge團隊正在開拓社交網絡分析的全新維度——從此前未被關注的,不適合做傳統事實核查的大量瑣碎言論切入,分析社交網絡上的議題設置和“敘事操縱”。

                    這在當下時間節點尤有特殊意義:

                    世界反法西斯戰爭后,無論技術突破和瓶頸交替,都隨著時間在歷史畫卷中跌宕起伏地推移。如同在時空坐標系中展開的《清明上河圖》,充斥著千萬種光景和古今眾生相。

                    以下為甲小姐對話Serge。

                    1.可證偽性正在經受挑戰

                    研究人員在實踐中通常會受到他們喜歡或不喜歡的敘述的影響——有點類似于Instagram上的熱門話題。

                    甲小姐:“不能證偽,不成科學”已成為一個科學界的普遍共識。但許多哲學家對此提出了質疑,認為可證偽性原則可能導致科學爭論變得永無止境。可證偽性是否是科學進步的必要條件?

                    Serge:根據流行的觀點,一個科學理論必須是可證偽的。

                    甲小姐:這是流行的觀點,但可證偽性是當下流行的范式嗎?

                    Serge:機器學習文獻在過去15年出現了爆炸式增長,每天都有大量論文發表、引用。在這些論文中,相關工作的部分往往會引用其他文獻,但引用的未必是與其工作最相關的文獻。這是因為文獻數量巨大,研究人員實際上是在回應該領域的主導敘述。

                    我們通常認為自己是卡爾·波普爾傳統中的科學家,只受可證偽斷言的影響。然而,科學研究也有潮流,比如生成對抗生成網絡和Transformers等技術。盡管這些論文的目標是遵循科學傳統,研究人員在實踐中通常會受到他們喜歡或不喜歡的敘述的影響——有點類似于Instagram上的熱門話題。

                    甲小姐:你的意思是,機器學習以來,科學家開始背離可證偽性的規范?

                    Serge:科學家們往往會宣稱自己不受這些影響,認為自己是客觀的,但他們畢竟是人類,會被這些流行的觀點所左右。這是我們認為不科學的東西,更多的是直覺和觀點。

                    甲小姐:你如何定義社交媒體中的不可證偽聲明?

                    Serge:我們首先需要討論關于事實核查的文獻。比如哥本哈根大學的伊莎貝爾·奧根斯坦(Isabelle Augenstein )教授開發了一種從確定聲明的核查價值開始的方法。我們會將一個聲明進行核查,并在0到1的范圍內確定其核查價值。

                    例如,有關加利福尼亞首府是薩克拉門托的聲明,因為可以在多個結構化知識庫中找到,非常適合進行語法和句法檢查。我們可以檢查這樣的聲明:“加利福尼亞州的首府是薩克拉門托”,并將其可檢驗性評分可能接近0.99。然后,我們將其提交至結構化知識庫確認答案。這種基于深度學習的可檢驗性系統處理大量聲明和訓練數據,評估不同聲明的核查價值。

                    但有些聲明,如“移民到加利福尼亞州是不好的”,更多反映個人觀點,不適合事實核查。相對地,如“自2020年以來,加利福尼亞州的移民數量持續增加”這類聲明則具有高核查價值。

                    所以我們特別關注那些難以驗證的聲明——這些聲明無法直接驗證,但它們在社交媒體上引發的討論頗具意義。多次核查可能幫助我們更好地判斷。

                    甲小姐:在你的研究中,哪些特定技術或工具被用來識別和分析不可證偽的聲明?

                    Serge:我們使用自然語言處理(NLP)技術、聚類和分組算法以及機器學習方法。

                    我們的目標是創建一個全球敘事信息設施(GNIF),以研究和組織社交媒體內容。

                    這些技術和工具的結合,使我們能夠更好地理解和處理大量的敘事內容,間接地幫助識別不可證偽的聲明。

                    我們能夠分析各種形式的文本。無論是推文還是Reddit評論,我們用NLP技術提取和理解這些內容中的敘述和主題。

                    其次,我們使用了聚類和分組算法。這些算法幫助我們將大量的社交媒體內容按照不同的主題或敘述進行組織。

                    例如,我們可以發現數百萬條推文中有成千上萬條內容非常相似,因為它們都在解決相同的基本敘述。

                    通過敘事聚類和斷言分組,我們將大量的內容組織成較小的集群,讓事實核查人員更高效地處理這些內容,而無需逐一檢查每個項目。這樣即使是不可證偽的聲明,也可以通過聚類和分組的方式被識別和分類,便于進一步的分析和處理。

                    我們會考慮兩個輸入,比如兩篇推文,然后根據不同敘事方面來衡量它們的相似性——這些內容可能涉及的話題包括核能與綠色能源之間的辯論,或者嬰兒配方奶粉與牛奶的討論。

                    網上有許多激烈爭議的話題,通常是虛假信息活動的結果。這些活動可能非常模糊。我們試圖理解的是,這些不同的陳述如何以語言或模因的形式表現出來,它們可能包含圖像、文字、音頻陳述等,看起來是完全不同的內容片段。你可能在社交媒體平臺上收集了數百萬個關于某個話題的討論,但所有數據蘊含的觀點可能只有幾十個。我們通過大型語言模型、深度度量學習等技術,試圖理解這些現象。

                    人類注釋對的可視化,子圖(a) 展示了正面對,即人類標注的相似或一致的敘事對。子圖(b) 展示了負面對,即人類標注的不相似或不一致的敘事對。來源:《Searching for Structure in Unfalsifiable Claims》

                    2.“真假”之外

                    并不是所有聲明(claim)都值得事實核查,也并非所有事實核查都能得到真或假的結果。

                    甲小姐:你打造的MSCOCO數據集是最著名的計算機視覺大規模數據集之一。當時是怎樣起步的?

                    Serge:我們在15年前開始進行物體檢測研究,起初只有一個包含200多種鳥類的小型數據集CUB200。COCO數據集最初是我的博士生Tsung-Yi Lin在微軟研究院的暑期實習項目,他當時的mentor是我的另一位博士生Piotr Dollá。這個項目逐漸演變成一個由學術界和工業界的研究人員組成的聯盟。他們希望創建一個能詳細描繪出自然環境中的日常物體的數據集,并對這些物體的名稱和空間位置進行精確地標注。

                    甲小姐:你將數據集命名為MSCOCO。我很喜歡《尋夢環游記》,它的英文名也是Coco。

                    Serge:是的,我們都喜歡“COCO”這個名字,它既有趣又易于記憶。

                    甲小姐:MSCOCO數據集出現后,計算機視覺領域的發展就像乘上了火箭。

                    Serge:是這樣的,我們圍繞它組織了越來越多的知識社區,COCO已經被數百萬人使用。我們從小范圍做起,最終發展出了一個帶來深刻影響的研究領域。

                    我參加的第一次計算機視覺會議是CVPR 1994,也是在西雅圖。那是三十年前了,當時大約有300人參會。而現在,2024年的西雅圖CVPR,有一萬兩千人參加會議。

                    甲小姐:已經30年了,是什么動力驅動著你對計算機視覺和人工智能研究始終如一的熱情?

                    Serge:從我記事起,我就對模式和事物分類很感興趣。中學時我做過關于對螺絲、螺栓和其他緊固件進行分類的課堂項目。上大學時我對音頻模式產生了興趣,特別是生物聲學、比如鳥類或鯨魚的叫聲。而在圖像方面,是指紋和人臉深深吸引了我。

                    我曾研究過如何從視頻中讀唇語。這個問題的各個方面都令我著迷:音頻與視覺的融合、不同說話者之間的差異和計算上的挑戰。在90年代初,數碼相機剛剛問世,但它們還沒有任何形式的計算理解功能。如今,你可能理所當然地認為取景器中會出現面部檢測框,或擁有能夠智能組織你整個家庭照片的相冊軟件,但那時候還不存在這些。

                    我當時就感覺這種技術的需求會非常大,同時我也喜歡技術背后的數學原理。我喜歡這些領域使用的技術,但我并不想主修數學或物理。如在聲音、視頻和圖像處理中使用復雜的數學方法來解決問題。

                    我總覺得,我來到這個世界的使命就是為了從事這樣的工作。

                    甲小姐:你在今年CVPR上做了哪些學術分享?

                    Serge:我的團隊在CVPR主會議上提交了多篇論文,我也在兩個研討會做了分享。其中一個報告是關于專注于計算機視覺研究的歷史,主要為了幫助年輕學者了解經典的計算機視覺技術,即在深度學習和變換器之前的技術。同時我還介紹了Visipedia項目,它始于2011年發布的CUB200數據集的擴展版本。目前,Visipedia的研究內容已經擴展到數以萬計的植物、動物和真菌,為自然界中的物體識別提供了重要的研究基礎。

                    另一個報告是我在今天的采訪中想著重分享的內容,跟敘事(narrative)、輿論、虛假信息有關,尤其在社交媒體發達的背景下。

                    甲小姐:你的工作為這一領域帶來了哪些創新?

                    Serge:虛假信息和社交媒體領域里的經典問題是事實核查。比如哥本哈根大學就有大量相關工作。一般做法是對于某些需要核查的言論,我們用人工智能系統搜索相關事實,并且根據事實預測一個0至1之間的真實性評分。

                    甲小姐:這種方法面臨什么挑戰?

                    Serge:這個方法本身沒有太大問題,挑戰來源于問題本身。并不是所有聲明(claim)都值得事實核查,也并非所有事實核查都能得到真或假的結果。比如 “熊貓是中國的國寶” 是一個能夠通過結構化知識庫和大量數據訓練模型、核查真實性的聲明。而 “搬家到加利福尼亞” 這句話則不然。

                    甲小姐:所以你從后者這類聲明里找到了研究的潛力?

                    Serge:后者這類聲明沒有被大量研究過,卻是同等重要的問題。這些言論或許沒有嚴格的真實/虛假定義,卻會在社交媒體上引發大量討論。在只需要對新聞媒體做事實核查的時代并不存在這個挑戰,而在社交媒體高度發達的今天,一類引發激烈討論,難以科學定性,或無法證偽的話題變得非常值得研究。

                    甲小姐:你能否舉一個產生了實際影響,甚至是帶來了比較激烈沖突的案例?

                    Serge:很高興你提了這個問題,讓我們舉一個有趣的例子。你在公共洗手間洗完手,有兩種擦干手的選擇。我不確定中國常用什么方式,在歐洲,你可以拿出紙巾,也可以使用熱風烘干機。

                    甲小姐:這兩種方法在中國也最常見。

                    Serge:生產烘干機的廠家和生產擦手紙的廠家與任意的連鎖飯店簽約,都能賺很多錢,整個市場大概會產生數十億美元的收入。但歐洲現在很多人對這兩種方式的區別有非常強烈的看法。很多人說其中一種方法可能會傳染疾病,而另一部分人說,大量用電或造紙會浪費樹木造成環境破壞。大多數持有這些觀點的人都不是公共衛生或者環境專家。

                    甲小姐:這些說法本身是否真實?

                    Serge:我們其實并不在乎言論的真實性,因為社交媒體里很多話題是無法嚴格證明或證偽的。但這個話題被提出來是因為一小部分人希望讓大眾相信,一種方法比另一種方法好。他們可能創建了數十萬個機器人生成相關內容?,F在你在社交網絡上搜索關于紙巾和空氣干燥器的討論,你會發現數百萬條評論。我們的研究不關注嚴格比較兩種方法的利弊并給出事實核查結果。我們更關心探測到這類被設計的議題。

                    3.社交媒體中“COCO”數據集

                    避免草率地做出決定。

                    甲小姐:你的研究開拓了另一個維度。傳統的事實核查關注語義(semantics)的真實性,而你的研究關注陳述或聲明的語用(pragmatics)——預測的目標不僅限于真實與否,而是拓展到社交網絡上由部分用戶或者大量機器人營造的,為了實現特定目的話題討論。這個研究你知道意味著什么嗎?

                    Serge:是的,我們在創造全新的東西。我們知道的多數相關研究只關注事實核查。但是我們在嘗試用話題相關的自然語言技術對社交媒體上的討論進行分組和聚類,幫助個人、企業、策略制定者了解社交媒體上正在發生的事情。我們不對這些話題和討論內容作價值判斷,只客觀顯示每個議題以何種形式被提出。

                    甲小姐:為了實現這個目標,我們首先需要一個數據集。建設這個數據集應該是個很大的挑戰。在開創計算機視覺研究的時候,你們從一個小型的鳥類數據集拓展到COCO。這次你們是怎樣切入的?

                    Serge:這類社交網絡行為通常有一個特征。某個話題可能有一百萬條相關推文,看起來有成千上萬個賬戶在參與討論。但是通過分析,我們可能發現其中有十萬個推文實際上發表了完全相同的東西,有非常相似甚至一樣的敘述。不過仍然請記住,這并不意味著這些討論是正確或錯誤。我們讓用戶看到不同言論的聚類和分組,使得事實核查、社交網絡分析工作者能更容易處理和理解大量內容,而不必處理突然涌入的幾百萬條推文。

                    甲小姐:這個系統是否可以實時處理社交媒體上的各種爭議話題?

                    Serge:我認為它能,也希望如此。假設在地中海,俄羅斯和美國的兩艘艦船相遇了。社交網絡便會開始討論,一組敘事便就此誕生。每幾個小時都會有新的信息出現,其中可能一方艦長發表了聲明,或者又有人發表一段手機錄音。這種情況下,某些敘事和議題得到關注,另一些可能會變得無關緊要。

                    甲小姐:你們希望實時抓取議題?

                    Serge:以及其它信息。為了給專業外交官提供幫助,我們希望制作一個儀表盤(Dashboard),提供全面的相關信息,也將這些事件放入世界背景中。這種系統可以讓人們避免草率地做出決定。我想強調,系統本身不決定哪方是對的,而是全面組織信息。

                    甲小姐:為了實現可靠的功能,需要解決哪些難點?

                    Serge:傳統和新的挑戰都有。傳統挑戰包括語言文化、情感偏見的影響。

                    舉例來說,《小美人魚》和《丑小鴨》都是丹麥作家的作品,但它們迪士尼電影版的故事都做了符合美國文化的調整。由于在社交網絡上美國敘述相對于丹麥敘述的更為主導,許多其他國家的網絡用戶中幾乎鮮有人知安徒生故事的原版。

                    在數據標注過程中,尤其是對社交網絡數據做標注更會受到語言和文化的左右。再比如情感分析已經是事實核查中的重要部分,而情感預測模型本身在訓練中可能存在大量偏見和刻板印象。AI模型訓練是垃圾進、垃圾出的過程,本身難以解決訓練數據帶來的問題,因此我們必須了解模型使用了什么訓練數據。我們可以說,沒有人類參與的事實核查是不存在(不可靠)的。

                    甲小姐:那新的挑戰有哪些?

                    Serge:語言模型生成的虛假內容是我們面臨的新挑戰。此前的社交媒體虛假賬號往往有非常簡單的模式可循。但是有了GPT和圖片生成模型后,虛假賬戶創建者可以生成更復雜和自然地虛假個人資料,進而偽造看起來很真實的社交媒體賬戶。這些賬戶不容易被傳統的虛假賬戶識別模型找到。這些生成式AI模型也給傳統的事實核查任務帶來了相應的挑戰。因此,生成式AI創建虛假信息和識別虛假信息,會是這個時代的貓鼠游戲。

                    4.AI未來

                    他們(OpenAI)可能還不知道我們的計劃。

                    甲小姐:這些挑戰看起來不是單純能通過模型能解決的,可能會上升到AI與人類合作這個維度。你似乎總是在新的維度上發現新的問題,然后從簡單切入去解決。

                    Serge:是的。我們的新想法可以與維基百科類比。人們曾經認為維基百科同一個節點只需要語義相同的不同語言頁面就好。實際情況是,不僅僅是語言不同。

                    同一詞條的不同頁面的語言、文化、價值觀、傳統,所有因素混合在一起。例如原子能和化石燃料,它在不同語言和世界不同地區的覆蓋方式非常不同。所以這提醒我們,我們試圖建設的AI系統并不是純粹自動化的,也不是一個獨立運行的模型。這是一個人類參與的系統,意味著你需要世界各地許多不同的人類社區來標注和組織數據,并考慮所有不同的部分。這是一個很深刻的大問題,因為偏見總是存在的。

                    甲小姐:所以和MSCOCO一樣,組織盡量全面和公平的數據本身就是這項研究的雄心壯志。

                    Serge:這是組織所有不同類型社區的過程。世界上不同地區,不同年齡段的人們學習文學、歷史、科學等不同專業,每個領域都有自己的故事。為了讓我所描述的研究獲得成功,我們需要大量了解各種議題的標注者。他們不必是專家,但他們需要對所須標注的內容,例如核能、創業,或者加密貨幣有一定的知識,才能知道敘事和議題的相似性。因此最大的挑戰是社區的組織,而非AI基礎計算和儲存設施。

                    甲小姐:Sam Altman或者Yann Lecun對你的思路有評論嗎?

                    Serge:他們可能還不知道我們的計劃。

                    甲小姐:我似乎在目睹一件創舉的最初階段:在更高的維度上發現問題,并找到最直接的切入點。

                    Serge:如果我們開發這種關于議題檢測的基礎設施,就像很多技術一樣,它可能被用于好事或者壞事。因此與很多商用AI不同,我們試圖開發公開、透明和可審計管理的系統。因此,我們將有一個完全透明的知識庫,用戶可以看到數據的編輯歷史,包括數據是什么時候被收錄的,被哪些標注者標注而已。

                    甲小姐:如何確保數據的準確性和客觀性?

                    Serge:簡單的答案是,我們無法保證。

                    但我們能做的最大努力是創建一個吸引數以萬計不同討論領域感興趣的人來對系統進行標注。盡量多的標注者可以幫我們帶來統計意義上的客觀。維基百科也有一些設計透明度和問責的機制,我們也會做同樣的事情。

                    甲小姐:這項研究會如何影響政策制定者、教育工作者和技術人員?

                    Serge:可以把我們正在做的事情看作對邏輯或者事實推理的補充。

                    假設一家公司想要提高自身的多樣性、公平性和包容性。于是他們的董事會召開會議,討論雇傭更多女性或少數族裔。這類討論在許多公司中都很常見,例如在某所大學里,學習電氣工程的女性可能不多,該系希望采取措施改變這一現狀。在這些會議中,可能會出現很多沒有知識或信息支撐的討論。

                    有些人會帶有偏見地表達女性不擅長數學這樣的觀點。這時就需要一個系統可以幫助系主任、CEO或需要領導這些討論的老師,他們可以從系統中提取一套敘述來構建討論。此外一旦系統開始工作,它會將語句索引并解析為預先存在的敘述。這樣,CEO、老師或會議主持人就能避免質量低或混亂的對話,擁有一個有效的結構和分類系統,引導討論并防止冗余的對話。

                    甲小姐:對于未來的社交媒體敘事、議題分析中,你認為技術發展的潛在研究方向是什么?

                    Serge:不同的領域都有其獨特的挑戰。其中一些是經典問題,例如處理大量數據以及如何標記它們,如何減輕偏見等。但在可視化方面,我們也面臨著大挑戰。

                    剛我們提到不同語言文化所面臨的差別。每一個特定話題都有許多不同角度的表述,不同標注者也會由于各自的偏見提供不同的標注。從信息理論的角度來看,試圖壓縮這些多樣化的賬目可能會導致信息的丟失或損壞。這類問題將貫穿整個項目,并且我們將頻繁遇到這些問題。

                    甲小姐:在你看來,視覺技術的哪些最新進展對未來影響深遠?

                    Serge:現在越來越多的研究者開始關注多模態數據,一個模型中同時處理圖像、文本和音頻等多種數據類型,這種方法通常使用如Transformer這樣的模型架構來解決復雜的實際問題。我相信這種趨勢會持續下去,未來的人工智能領域新人會發現,同時掌握多種專業技能比單獨深入一個領域,如自然語言處理或計算機視覺,更為自然。

                    個人認為,盡管有人聲稱人工智能將完全取代醫生,這種說法夸大其詞了。但我確信,在放射學、皮膚病學和組織病理學等領域,人工智能輔助系統將會普及并受益每個人。

                    至于無人駕駛汽車,盡管過去有預測稱視覺技術和人工智能的進步將實現無人駕駛汽車的普及,但我認為這種情況不太可能發生。除非政府采取措施限制傳統汽車在某些車道上行駛或完全禁止使用傳統汽車,否則在美國,無人駕駛汽車成為常態的可能性極小。

                    甲小姐:我喜歡你的論文。我的想法也有類似之處。技術發展同步并舉地解鎖著新的認知維度,最有價值的方法論恰是有極簡切入點卻可輻射全局的方法論。

                    Serge:你最感興趣的是什么方法論?

                    甲小姐:舉個小小的例子。沿著可證偽性走,科學會自己走上否定之否定的迭代之路……回到我們萬般熟悉的,科學革命的結構。

                    *周航對本文亦有貢獻。

                    由于本文涉及學術討論,在此附作者相關簡介:

                    • 張一甲,甲子光年創始人,2013年畢業于北京大學數學科學學院,獲國家發展研究院經濟學雙學位;曾獲中國數學奧林匹克金牌,入選國家集訓隊;研究方向為金融數學和博弈論,兼任北京大學數學科學學院理事。

                    • 周航,甲子大腦負責人,2019年畢業于北京大學數學科學學院;研究方向為稀疏優化與非凸優化。

                    *參考資料

                    • Searching for Structure in Unfalsifiable Claims.pdf

                    • 978-3-319-10602-1_48.pdf“Microsoft COCO: Common Objects in Context”MSCOCO數據集:Serge被引用次數最高的論文。

                    • 托馬斯·塞繆爾·庫恩《科學革命的結構》



                    • 19422
                    • 0
                    • 0
                    • 0
                    評論
                    三级网站视频国产在线观看_自慰毛片无码地下_中码AV在线欧美老妇精品_淫秽录像一级a片在线免费看

                        <delect id="rljdd"><span id="rljdd"><sub id="rljdd"></sub></span></delect>

                        <rp id="rljdd"><i id="rljdd"><output id="rljdd"></output></i></rp><nobr id="rljdd"><th id="rljdd"></th></nobr>
                        <big id="rljdd"><meter id="rljdd"></meter></big>

                        <em id="rljdd"><i id="rljdd"></i></em>
                          <em id="rljdd"></em><dfn id="rljdd"><i id="rljdd"><form id="rljdd"></form></i></dfn>
                              <big id="rljdd"><noframes id="rljdd">
                                  <meter id="rljdd"></meter>
                                    <meter id="rljdd"></meter>