Internet

TechCrunch分: AnthropicがAIに回答を提供させるトリックを発見する方法

Sunday, September 29 2024

それを構築すれば、人々はそれを破ろうとします。時には、何かを構築する人々自体がそれを破ることがあります。これは、Anthropicとその最新の研究に当てはまるケースで、現在のLLM技術における興味深い脆弱性を示しています。ほとんどの場合、質問に続けていくと、ガードレールを破り、大きな言語モデルが、設計上は提供されない情報を教えてくれるようになることがあります。たとえば、爆弾の作り方など。

もちろん、オープンソースのAI技術の進歩を考えれば、ローカルに自分自身のLLMを立ち上げて、好きな質問をすることができます。しかし、より一般向けのものについては、これは考慮に値する問題です。今日のAIの面白いところは、どれだけ速いペースで進化しているか、そして我々が構築しているものをよりよく理解するためにどれほどうまくしているか、ということです。

もし私に思考を許してもらえるならば、Anhtropicが最近共有した内容について話し合いましょう。LLMや他の新しいAIモデルタイプがより賢く、より大きくなるにつれて、Anthropicが示すようなタイプの質問や問題がより多く出てくるのではないかと思っています。これを繰り返すかもしれませんが、一般的なAI知能に近づくほど、それは思考エンティティに似ているべきであり、プログラム可能なコンピュータではないはずです。そうであれば、限界条件を突き詰めることが不可能になった時点で、私たちはより難しい時を迎えるかもしれません。とにかく、Anthropicが最近共有した内容について話し合いましょう。

インタラクティブ・ニュースです

TechCrunch分: AnthropicがAIに回答を提供させるトリックを発見する方法

Popular articles

ドイツのLLMメーカーAleph AlphaがAIサポートに転換

フランスはオリンピック中にジョエル・エンビードをブーイングし続けてきました。今、米国はバスケットボールでフランスと対戦します

米国大手製薬会社Cencora、データ侵害で米国人の健康情報が盗まれたと発表

Googleの新しいスタートアッププログラムは、公共インフラにAIを導入することに焦点を当てています

株式市場今日：インフレ報告後のウォール街が最高レベルの上昇を見せる