編輯點評:用學術視角學習產業思維
北京可鹽信息技術有限公司官方打造的一款科技為主的資訊閱讀平臺,可鹽app是硬核科技研究領域的資訊類產品,包含了新能源,量子技術,互聯網,人工智能,太空和生命科學等內容。
平臺優勢
學術視角
若心有疑,必求確義
產業思維
不炮思辨,不止踐行
敬畏科學
積土而為山,積水而為海
支持的分類
新能源,最新新能源相關的科技資訊信息;
量子技術,學習和分享更多關于量子的知識;
互聯網,人工智能,太空和生命科學等等。
功能介紹
盡量用通俗易懂的語言為您呈現科學研究的即時進展,與您一起探求科學的真相,探索人類未來可能的演進路徑。
以審慎求真的視角觀察科技變革背后的原動力,穿透實驗的迷霧,梳理最新科研成果與技術傳承脈絡。
懷著真誠的熱忱努力建立連接科學研究與產業應用的橋梁,為中國乃至全球的科技創新貢獻綿薄之力。
敬畏科學真理,希冀產業革新,若心有疑,必求確義,不熄思辨,不止踐行,積土而為山,積水而為海。
官方介紹
“可鹽”是一款硬核科技研究領域的資訊類產品。
在這里,你將第一時間獲得全球各大科學研究領域的實時突破性進展與產業應用動態,包括但不限于以下學科與產業:量子、新材料、人工智能、大數據與云計算、新能源、生命科學、空天科技、智慧農業、尖端通信、芯片半導體······。
深度學習模型
從管理庫存到與客戶接口。無論一家公司從事什么業務,軟件都扮演著重要的角色。因此,軟件開發人員的需求比以往任何時候都大,這促使人們便想自動化一些簡單但耗時的工作。
像Eclipse和Visual Studio這樣的工具,開發人員在編寫代碼時可以很容易地插入到工作中。自動化流程是由復雜的語言編寫的,而語言模型是在吸收了數千個例子之后,學會閱讀和編寫計算機的代碼。但是,就像其他建立在大數據集上的深度學習模型一樣,為代碼處理而設計的語言模型也存在漏洞。
麻省理工學院電子工程與計算機科學系的研究生Shashank Srikant說:“黑客可以操縱這些模型的輸入,為他們所用。所以我們正在努力研究以預防這種情況。”
在一篇新論文中,Srikant 和麻省理工學院Watson人工智能實驗室揭示了一種自動方法,可以發現代碼處理模型中的問題,并對它們進行再訓練,使它們更靈活地抵御攻擊。麻省理工學院研究員Una-May O 'Reilly和IBM附屬研究員Sijia Liu也參與了編寫,他們利用人工智能使自動化工具更智能、更安全。該團隊將在2021年5月的國際學習表征會議上展示其研究結果。
一臺能夠自己編程的機器聽起來像是科幻小說。但計算能力的指數級增長,自然語言處理的進步,以及互聯網上大量的免費代碼,使軟件設計的某些方面自動化成為可能。
在GitHub和其他程序共享網站上的代碼編寫的語言模型,就像一個智能助手,預測軟件開發人員下一步將做什么,并提供幫助。他們可能會建議適合手頭任務的程序,或者生成程序摘要來記錄的工作方式。還可以訓練代碼處理模型來發現和修復bug。但是,盡管它們具有提高生產率和提高軟件質量的潛力,但它們也帶來不少風險。
Srikant和他的同事們發現,代碼處理模型可以簡單地通過重命名一個變量,插入一個偽造的打印語句,或者在模型試圖處理的程序中引入其他修飾性操作來欺騙。這些經過細微修改的程序正常運行,但欺騙模型,使其無法正確處理,從而產生錯誤的決策。
這些錯誤可能會對所有類型的代碼處理模型產生嚴重的后果。惡意軟件檢測模型可能會被欺騙,將惡意程序誤認為是良性程序。代碼完成模型可能會被欺騙,提供錯誤或惡意的建議。在這兩種情況下,病毒都可能入侵程序。類似的問題也困擾著計算機視覺模型:編輯輸入圖像中的幾個關鍵像素,模型就會把豬當成飛機,把烏龜當成步槍,麻省理工學院的其他研究也證實了這一點。
與最好的語言模型一樣,代碼處理模型也有一個關鍵缺陷:它們是單詞和短語之間統計關系的專家,但只能模糊地理解它們的真正含義。例如,OpenAI的GPT-3語言模型可以寫出美好或荒謬的散文,但只有人類讀者才能分辨出兩者的區別。
代碼處理模型沒有什么不同。Srikant說:“如果他們真的在學習程序的內在屬性,那就很難愚弄他們。但他們不是。他們目前相對容易被欺騙。”
在這篇論文中,研究人員提出了一個自動改變程序的框架,以暴露處理程序的模型中的弱點。它解決了一個由兩部分組成的優化問題;一個算法識別程序中添加或替換文本導致模型產生最大錯誤的站點。它還確定了什么樣的編輯構成了最大的威脅。
研究人員說,這個框架揭示的是,一些模型有多么脆弱。他們報告說,他們的文本摘要模型有三分之一的時間在對程序進行一次編輯時失敗;超過一半的時間在五次編輯時失敗。另一方面,它們認為模型能夠從錯誤中吸取教訓,并在此過程中獲得對編程的更深入理解。
“我們的模型框架,以及對這些特定漏洞的再訓練,有可能幫助代碼處理模型更好地理解程序的意圖,”這項研究的資深合著者Sijia Liu表示,“這是一個值得探索的令人興奮的方向。”
在此背景下,一個更大的問題仍然存在:這些黑盒深度學習模型到底在學習什么?“它們是否像人類一樣思考代碼?如果不是,我們又該如何制造它們?””麻省理工學院研究員Una-May O 'Reilly說,“這是我們面臨的重大挑戰。”
熱門評論
最新評論