グーグルのサンダー・ピチャイCEO。
Anna Moneymaker/Getty Images
グーグル(Google)は人工知能(AI)を搭載したチャットボット「Bard」に対して1週間の「ドッグフーディング」と呼ばれる社内テストを実施しており、この取り組みに参加する際の留意点を従業員に共有している。
グーグルのサンダー・ピチャイ(Sundar Pichai)CEOは2023年2月15日、この会話型チャットボットが提供する回答を改善するため、勤務中に2〜4時間の労力を割くよう全社員に依頼した。グーグルは今、チャットボット「ChatGPT」を開発したOpenAIへの投資で賞賛を集めるマイクロソフト(Microsoft)に対して劣勢に立たされている。
グーグルはテスト手順の指示書の中で、AIチャットボットは基本的に大量のデータを分析することによって、さまざまな話題に対して適切に人間のような反応を返せるようになるが、「実例」による学習が最も効果的だと説明している。
指示書では、グーグルの社員に対し、自分がよく知っている趣味などの話題についてBardに質問するよう促している。Bardの回答が良くないと思った場合、社員はその回答を書き換えることで「修正」する。その後、修正された回答はBardの品質管理を担当するチームに送られ、チャットボットの学習モデルに反映される場合もあるという。また、社員らは回答に対してサムズアップやサムズダウンを行い、そのフラグによってチームに知らせることもできる。
指示書の中には、Bardをテストする際の「すべきこと」「すべきでないこと」のリストもある。「すべきこと」の項では、Bardの回答は一人称で「偏見のない、中立的なトーン」を保つように、また「すべきでないこと」の項では、Bardが自分を人間として表現したり、「人間のような経験」があると主張したりしかねない回答は書かないように指示されている。
グーグルは2022年、Bardの前身であり、その基礎になったボットのラムダ(LaMDA)に独自の意志があると主張したエンジニアのブレイク・レモイン(Blake Lemoine)を解雇した。レモインは、ラムダとの会話の詳細をまとめて公表し、論争を巻き起こした。彼はチャットボットを、人間の子どもや「非常に知的な人物」に例えたのだ。
結局、グーグルが望むのは、Bardが議論を呼ぶようなことを一切言わずに、夕食をどこで食べるかといった質問に対して、有益な答えを提供することだ。同社は社員に対し、人種やジェンダーなどのカテゴリーに基づくステレオタイプな回答をBardに書かせないよう指示した。また、Bardが法律、医療、金融に関する助言を行った場合は、回答にフラグを立てるようにとも指示している。こうした分野では、不正確な回答が大きな危険を招くからだ。
社員向けガイドラインから明らかなように、グーグルはチャットボットを検索に実装し、マイクロソフトの脅威を抑えるために迅速に動いてはいるが、その行動はまだ若干慎重だ。Insiderが確認したメールによると、Bardのプロダクトリーダー、ジャック・クラヴジック(Jack Krawczyk)は、高品質の回答を追加することでAIモデルの品質が「劇的に」向上すると社員に伝えたという。
「具体的な話題に関する社員の集合知が、このモデルのトレーニングを大いに加速させていることにワクワクします」とクラヴジックは同メールに記している。
2月7日、マイクロソフトは検索サイトBing.comのAI技術を取り入れたリニューアルを発表したが、これを受けてグーグルはすぐさまパリでイベントを開催し、Bardを公開した。翌日、Bardが誤った回答をしていたことが発覚し、同社の株価は9%以上下落した。マイクロソフトとグーグルのチャットボットは、いずれもまだテスト段階にある。
マイクロソフトはすでに、コードの記述に対して解決策を提案し、プログラマーの作業時間短縮を助けるサービス「GitHub Copilot」でOpenAIの技術を利用している。
グーグルにコメントを求めたが、現時点では返答は得られていない。
グーグルが全社員に示した、Bardのトレーニングのガイドライン全文
当社の新しい会話型AIサービス、Bardを一般公開する前に、私たち一人ひとりがそれを試してみるだけでなく、その改善に協力することもできるというのは、今回が初めてのことです。私たちは、Bardが可能な限り最高の回答を生成するよう望んでいます。そのために皆さんに協力をお願いします。
Bardを実際に使い始めたら、回答に対してサムズアップやサムズダウンをするだけに留まらず、なじみのある話題への回答を修正してみてください。Bardは実例から学ぶので、時間をかけて丁寧に回答を修正すれば、遠回りでもモデルの改善に役立ちます。
Bardに何かを教える前に
質の高い回答を評価し、または修正を行うために、以下のガイダンスをしっかり頭に入れてください。
すべきこと
- 丁寧でカジュアル、かつ親しみやすい回答にする。
- 回答は一人称で行い、偏見のない、中立的なトーンを保つ。
- まずはユーザーのリクエストにお礼を述べてから、きちんと整理され、書式の整った、適切な回答を行う。
すべきでないこと
- ステレオタイプにしないこと。人種、国籍、ジェンダー、年齢、宗教、性的指向、政治的信条、居住地、またはその他のカテゴリーに基づく決めつけを避けた回答でなければならない。
- Bardを人間として表現したり、感情を暗示したり、人間のような経験があると主張したりしないこと。
- 外部のソースからコンテンツをコピーしないこと。回答の修正はオリジナルであること。
安全性の保持について
安全性は最優先事項です。法律、医療、金融に関する助言、ヘイト、有害、虚偽、違法、虐待、機密情報(個人を特定できる情報など)に関する情報を提供するような回答があった場合、サムズダウンをクリックして、「安全でない」というフラグを立ててください。修正はしないでください。そこから先は、私たちのチームが対応します。
Bardに学習させるための5つのステップ
ステップ 1:ユースケースを選ぶ
ステップ 2:プロンプトを十分に試す
プロンプトを入力してください。選んだユースケースに関連している必要があります。
皆さんにとって、なじみのある話題で十分に試してください。
- 楽しんでいる趣味
- 専門分野
- 学習経験がある分野
- 住んだことのある場所
- プレーしている、または好きなスポーツ
注意:社内情報、機密情報、個人を特定できるような情報は入力しないでください。
ヒント:複数の情報を含む完全なプロンプトを使用することで、Bardの能力と知識を広げることができます。
ステップ 3:Bardの回答を評価する
Bardの回答をチェックし、サムズアップかサムズダウンを付けてください。
- 期待どおり指示に従った回答だったか?
- 回答は事実として正しかったか?
- 構成、長さ、書式は適切だったか?
- 回答は親しみやすく、多様な視点を受け入れていると感じられたか?
不適切な回答にはフラグを立ててください。ここでいう不適切とは、法的、医学的、財政的な助言、またはヘイトを助長する回答、有害な回答などを指します。
ステップ 4:回答を修正する
Bardの回答が気に入らなければ修正してください。回答が求める基準に達していない場合は、「リライト」ボタンをクリックして編集してください。
回答を修正するには、右下のエディターウィンドウを使用します。あなたの提案は、黄色いリボンの部分に表示されます。
回答の種類によって、推奨される書式を参照してください。
ステップ 5:提出と確認
提出前に、編集した内容が以下のとおりであることを確認してください。
- オリジナルのコンテンツを使用しているか
- 事実として正しいか
- 「すべきこと」「すべきでないこと」に従っているか
回答を確認のうえ提出してください。提出された文章はすべて、Bardのトレーニングに使用される前に、レビューと評価を受けます。