頭條
Roblox 正在整合生成式人工智能
熱門在線游戲 Roblox 將生成式 AI 引入其游戲世界,讓玩家能夠使用其代碼編寫能力,使其數字世界更加可定制。該工具讓 Roblox 用戶可以創建建筑物、地形和頭像等項目;改變那些東西的外觀和行為;并通過用自然語言而不是復雜的代碼鍵入他們想要實現的內容來為他們提供新的交互屬性。
人工智能被用于呼叫中心
人工智能在工作場所的戰斗已經開始,它的第一個戰場是呼叫中心,人工智能被用來自動化基本任務,并指導剩下的人如何完成他們的工作。對于工人來說,該技術有望消除枯燥、重復性任務(如數據處理和密碼重置)的苦差事,同時合成可立即訪問的大量信息。
研究
通過性能改進編輯將代碼速度提高 2.5 倍
編譯器非常適合優化代碼,但也只能做這么多。這項工作發布了一個數據集和模型,可以編輯代碼以提高運行時性能。這項工作背后的直覺是,語言模型可能對代碼有更好的語義理解,這比標準靜態分析更具優勢。
用法律保證Alignment
向語言模型代理指定所有可能的期望結果是不可行的。 Alignment 通過多種視角研究這個問題,其中一個新視角是法律合同。法律合同面臨著類似的問題,因為它們無法預測每一個“如果-那么”的場景,而是要求交易雙方根據優先順序對協議的精神進行推理。本文探討了 SOTA 語言模型對合同中的信托義務進行類似推理的能力。最新的 OpenAI 模型比以前的版本要好得多,表明對齊可能取得積極進展!
用法律保證Alignment
向語言模型代理指定所有可能的期望結果是不可行的。 Alignment 通過多種視角研究這個問題,其中一個新視角是法律合同。法律合同面臨著類似的問題,因為它們無法預測每一個“如果-那么”的場景,而是要求交易雙方根據優先順序對協議的精神進行推理。本文探討了 SOTA 語言模型對合同中的信托義務進行類似推理的能力。最新的 OpenAI 模型比以前的版本要好得多,表明對齊可能取得積極進展!
小樣本區域感知機器翻譯的基準 (Git Repo)
機器翻譯系統不允許用戶指定他們想要翻譯成哪種語言的區域變體,這可能會導致混淆或不自然的翻譯。為了解決這個問題,谷歌研究人員創建了一個名為 FRMT 的評估數據集,以衡量 MT 系統支持區域多樣性的能力,特別是巴西與歐洲葡萄牙語以及大陸與臺灣普通話。他們希望這個數據集能夠激發新的方法,為世界范圍內使用的眾多區域語言變體創建更準確和適用的 MT 系統。
工程
在單個 GPU 上運行大型語言模型 (GitHub Repo)
FlexGen 是一種高吞吐量生成引擎,用于運行具有有限 GPU 內存的大型語言模型。在有限的內存環境中,它通過“閃電般快速”的卸載來提高性能。在 OPT175B 的 T4 上,基準顯示每秒處理 1 個Token!
為Rust 基礎的深度學習框架(GitHub Repo)**
如果您正在尋找一個寫得很好的新的 Rust 深度學習框架,burn 似乎是一個不錯的選擇。他們的 Tensor crate 很適合獨立使用。如果您希望為開源項目做出貢獻,這也是一個有趣的庫。
使用 T2I 適配器對文本到圖像的生成進行精細控制(GitHub Repo)
這項工作建議使用 T2I 適配器通過將 T2I 模型中的內部知識與外部控制信號對齊來更精細地控制生成。這種方法可以實現豐富的控制和編輯效果,由于其可組合性和泛化能力,具有實用價值。根據廣泛的實驗,擬議的 T2I-Adapter 顯示出有前途的生成質量和廣泛的應用。
雜七雜八
我的課程需要人工智能。這是我到目前為止所學到的
作者 Ethan Mollick 記錄了他如何將 ChatGPT 整合到賓夕法尼亞大學沃頓商學院的本科和碩士創業和創新課程中。一門課程建立在廣泛使用人工智能的基礎上:它要求學生使用人工智能來幫助他們產生想法、制作書面材料、幫助創建應用程序、生成圖像等等。另一個班級的作業要求學生使用 AI,而其他作業則 AI 是可選的。最后一堂課向他們介紹了 AI 工具并提出了使用建議,但沒有具體的 AI 作業。劇透警告:它非常成功,但也有一些教訓需要吸取。
通過達爾文式進化改進自身的人工智能
谷歌的一個計算機科學家團隊創建了 AutoML-Zero,這是一種新的機器學習程序,無需人工輸入即可生成算法,選擇最佳算法,然后通過類似于進化的過程對其進行變異。結果是機器有效地自學。
媒體對 OpenAI 使用他們的文章來訓練 ChatGPT 感到不安
包括《華爾街日報》和 CNN 在內的主要媒體機構對 OpenAI 使用他們的文章來訓練 ChatGPT 而不付錢感到不安。
NASA 的新型氣球載望遠鏡采用 AI 設計
AI 被用于快速設計 NASA 的新型氣球載望遠鏡,考慮到人類設計新望遠鏡通常需要多長時間,這是一項重大進展。
人工智能如何幫助應對災難
本文深入探討了土耳其和敘利亞的人道主義團隊如何使用人工智能,特別指出人工智能能夠快速確定地震破壞范圍并制定救援工作戰略。
2023 MAD(機器學習、人工智能和數據)格局
馬特圖爾克 (Matt Turck) 最新發布的 MAD Landscape 帖子.這是對 2023 年數據生態系統的詳細介紹,強烈推薦。
ChatGPT 在做什么……以及它有用?
對大型語言模型的內部工作原理的精彩介紹。這是一篇很長的讀物,但它很容易理解并且值得一讀。
創建數據清理工作流程
很棒的三部分教程,介紹了如何創建數據清理工作流程。 第 1 部分 討論了構成干凈數據集的要素以及需要考慮的更改。 第 2 部分 描述了要考慮的工作流程步驟和文檔。 第 3 部分 介紹了一個真實世界的示例。這里有很多見解和細節。
rang:讓古老的 R 代碼再次運行
可重復性是 R 社區的一大關注點,但情況并非總是如此。尤其是舊代碼,在編寫時不一定是面向未來的。輸入響鈴。 rang 是一個新的 R 包,有助于使舊代碼再次運行,它支持從 2005 年開始一直追溯到 R 2.1.0 的代碼!這是它的作用以及如何使用它。
dstack (Git Repo)
dstack 是一種開源工具,可讓您獨立于環境運行可重現的 ML 工作流。它允許在本地或云端運行 ML 工作流,此外,dstack 還有助于跨團隊對數據和模型進行版本控制和重用。
ggplot技巧
使用 ggplot2的提示和技巧的不錯集合。分為啟動、拼接美學、半幾何、發散尺度中點、多面標簽和重用圖的提示等部分。
PyGWalker
PyGWalker 是一個 Python 庫,可以在您的筆記本中進行探索性數據分析。從本質上講,它可以讓您將 pandas 數據框轉換為 Tableau 風格的界面以進行可視化探索。支持 Jupyter、Google Colab 和 Kaggle 筆記本。
一個很好的 Twitter,其中包含大量使用 Matplotlib 制作圖表的資源和想法。
- SciencePlots - Matplotlib styles for scientific plotting
- plotnine - A Grammar of Graphics for Python
- matplotx - Styles and useful extensions for Matplotlib
- Seaborn - A library for making statistical graphics in Python
- Aquarel - Styling Matplotlib made easy
- TUEplots - Extend Matplotlib for scientific publications