プロンプトエンジニアになるために必要な7つのスキル
プロンプトエンジニアの将来性は、非常に有望と言われています。
AI技術の進歩に伴い、AIが実行できるタスクはますます増えてきています。
そのため、AIにタスクを指示するために必要なプロンプトを設計できるプロンプトエンジニアの需要は、今後も高まっていくと考えられます。
今回は、そんなプロンプトエンジニアになる方法やスキルの紹介や、将来の予想しますので、ぜひ参考になさってください。
AI時代に活躍できる人になりましょう。
関連記事:ChatGPTの使い方のコツを解説!という名目で自分がAIを使う上でのあるある言いたい
INDEX
プロンプトエンジニアとは
プロンプトエンジニアとは、AIにタスクを指示するために必要なプロンプトを設計、開発、改善を行なう人々のことです。
プロンプトとは、人間がAIに出す適切な指示のことです。
AIがタスクを理解し、より効果的な生成をさせるためにはより複雑なプロンプトの設計が必要となります。
プロンプトを設計する際には、以下の点に注意する必要があります。
- AIがタスクを理解するために必要な情報がすべて含まれていること
- AIが理解しやすい言語で記述されていること
- AIがタスクを効率的に実行できるように記述されていること
関連記事:ChatGPTが使えない?途中で止まった時の対処法や活用のコツを解説
プロンプトエンジニアになるには
世の中にはまだ「プロンプトエンジニア」という肩書きで何かができる、という資格はありません。
そのため、日常的にプロンプトを作成して公開し続けること、もしくは現在あるChatGPTのOpenAIのAPIを取得して、応用した新たな使い道を発見することなどが必要です。
githubをポートフォリオ代わりに使用するということもできません。
GPTストアならポートフォリオ的に使えるかもしれませんが、未だ予想が難しい状態です。
現に12月2日、OpenAIからGPTsのフィードバックの依頼のメールが届きました。
受け取った方もいらっしゃるかと思いますがOpenAI側も情報収集の段階と予想されます。
GPTsを発表してからまだ1ヶ月に満ちませんが、皆様やビルダーコミュニティが作成した有用で楽しいGPTsに、私たちは驚いています。
私たちは皆様からのフィードバックに基づいて、GPTsの改善を続けています。
アクションを改善するために、設定インターフェースを更新し、ワンクリックテストを可能にし、プレビューでのデバッグメッセージを追加し、複数のドメインを許可するようにしました。
また、アップロードされたファイルに関する質問もありました。アップロードされたファイルはコードインタープリターを使用する際にダウンロード可能ですので、この機能をデフォルトでオフにし、これをより明確に説明するメッセージを追加しました。
さらなるフィードバックがあれば、ぜひこちらでお聞かせください。次に何があるかというと、来年初めにGPTストアの立ち上げを計画しています。今月にリリースする予定でしたが、予期せぬいくつかのことに時間を取られてしまいました!
その間にも、ChatGPTにいくつかの素晴らしいアップデートを予定しています。GPTを構築するために時間を費やしてくださり、ありがとうございます。
OpenAI
さらに、GPTストアに関しては2024年1月リリースと遅れることを発表したのもこの時です。
関連記事:GPT Store(GPTストア)開始記念!GPTsの作り方を実践しながら紹介!
GPTストアが開始された所管
GPTストアが開始されましたが、実際に使う場合の使い分けができるなと感じました。
日頃から使うようなものに関してはGPTsで作成し、たまに使うものに関してはプロンプトテンプレートを使用し、滅多に使わないものに関しては普通にチャットで使うといったイメージです。
GPTストアでも多くのユーザーが頻繁に使うようなものが作れれば、ご自身のGPTを使ってくれる方も多いでしょう。
ただ、オリジナルGPTを作るのに若干コツは必要かなとも思います。
ゴールシークプロンプトに似ているなと感じました。
関連記事:ChatGPTのゴールシーク(Goal Seek)プロンプトとは?使い方や例文を実践して解説
ChatGPTの代わりになるものが現れた場合
仮にGPTモデルに代わるもの(PaLM2、Claude2.1あたり)ができたとしても、LLMの知識を身につけ続けていくことは大事だと思います。
なぜなら、GPT(というよりLLM)の代わりになると言われているマルチモーダルAIも結局はプロンプトで動くからです。
GPTベースである程度何でも作れるようになれば、代わりになるモデルができたとしても、そのモデルのプロンプトに転用できる可能性は高いので、やはり実績の証明とスキル向上のために、プロンプトを公開し続けることが効果的です。
2023年12月に発表されたGoogleのGeminiはマルチモーダルAIという、設計段階から画像認証や動画認証などのタスクをすることを目的としたAIで、LLMとやや異なります。
Googleが出している動画では手書きの絵を理解する、スリーシェルゲームを答えるなど、マルチモーダル感がありました。
現在は英語圏のBardにGeminiの標準モデルになるであろうGemini Proが搭載されていますが、BardベースだとGPT-4とあまり変わらない印象です。
Gemini ProのAPIを使ってみましたが、確かにLLMとは違う印象は受けました。
ただ、よりプロンプトが大事だとは感じました。
Gemini UltraがリリースされればGPTをはじめとしたLLMを超える可能性がありますが、結局AIのコントロールの必要性があることには変わらないと予想されます。
呼び方は変わるかもしれませんが、AIができないことを補完するためとしても、AIが進化しすぎて何でもできるようになったとしても操る技術は必要で、現在とやや意味合いが違うかもしれませんがプロンプトエンジニアは必要だと思います。
関連記事:GoogleのGemini Pro Visionを何も知らずに使ってみた
プロンプトエンジニアの将来性
現在は動向がより速く、より読みづらくなってきていることを実感していますが、プロンプトエンジニアリングには将来性はあると思われます。
その理由は、AGI(Artificial general intelligence:汎用人工知能)の定義とそのレベルにあります。
2023年11月にGoogle DeepMindの出した論文で、AIの中でも汎用性の効く高品質な「AGI(汎用人工知能)」には自然言語処理と画像・映像処理が必要と定義する案が出ました。
まさにChatGPT、Bardが該当しています。両者ともAGIのレベル1に達したという内容もありました。
関連記事:【2023年AI決勝戦】ChatGPT(GPT-4)VS Google Bard(PaLM2)対決
AGIの定義からみるプロンプトエンジニアの将来性
AGIを定義するというのはAI界での論点の1つでしたが、有力な説の1つに「AI完全問題」というものがあります。
その中で「AI完全」を達成するためには、以下の条件を満たさなければならないという意見があります。
満たさなければ「AI非完全」「弱いAI」とされます。
- チューリング・テストに合格すること
- 画像・映像処理(コンピュータ・ビジョン)
- 自然言語処理
チューリングテストとは簡単にいうと「AIの書いた文書を人間が書いたと騙せるかどうか」を試す実験です。
他にも大学入試を受けさせたり、コーヒーを淹れさせたりと色々なテストが行われていますが、現状では上記3つのテストが有効とされています。
自然言語処理自体はAIの進歩に欠かせないものであることから、プロンプトエンジニアリングは必要かと思います。
なお、GPTsの動向を見ていると、汎用人工知能であるGPT-4のモデルをプロンプトを活用して特化型人工知能を作成するニュアンスが強いので、汎用型の発展の観点から見ても、特化型の進化の観点から見てもプロンプトエンジニアリングはやはり大事なのだと感じています。
関連記事:AGIとは?Google DeepMindの論文「AGI(汎用人工知能)のレベル」を読むために必要な知識について解説
AGIのレベルからみるプロンプトエンジニアの将来性
Google DeepMindの出した論文“Levels of AGI: Operationalizing Progress on the Path to AGI”(AGIのレベル:AGI への道における実用化の進展)でAGIのレベルについての案が出ました。
この論文によると以下のようにAGIのレベル分けを行います。
- レベル0:AGIではない
- レベル1:単純なルールベースシステムで使用可能
- レベル2:有能な成人の50パーセントほどの能力
- レベル3:有能な成人の90パーセントほどの能力
- レベル4:有能な成人の99パーセントほどの能力
- レベル5:有能な成人を超える能力
前述したように、ChatGPT(GPT-4)、Bard(PaLM2)と、それに加えMetaのLlama2がレベル1とされましたが、やっとAGIの入り口に到達したのです。
元々は楽観主義的な議論で、もっと早く到達する見込みだったのが、何度かのAIの進化を経てやっと見えてきただけです。
AGIの進歩は予測はできないと言いますが、もっと能力を上げるためにはプロンプトエンジニアリングも必須と言えるのではないでしょうか。
AGIレベル2以降の予想は難しいですが、自然言語による抑制は必要かと思われます。
11月28日のGoogle DeepMindの論文からみるプロンプトエンジニアの将来性
11月28日には、Google DeepMindはまた新たに論文を発表しています。
タイトルは「Learning few-shot imitation as cultural transmission | Nature Communications(文化伝達としての数発模倣の学習 | ネイチャーコミュニケーションズ)」です。
趣旨をまとめると、以下のような内容です。
AIエージェントが文化伝達を通じて少数ショット模倣を学ぶ方法に関するものです。
AIがリアルタイムで専門家のデモンストレーションを模倣し、新しいコンテキストでそのデモンストレーションを再現できるようになることを目指しています。
この研究は、人間の文化的進化が技術や知識の蓄積をもたらしたように、AIにおける文化的伝達と進化を促進することを目的としています。AIはニューラルネットワークで構成され、深層強化学習を用いて訓練されます。
訓練プロセスには、メモリ、専門家のデモンストレーション、注意喪失、自動ドメインランダマイゼーションなど、いくつかの重要な要素が含まれています。
これらの要素は、エージェントが複雑な環境で文化伝達を実現し、広範なタスク空間で一般化する能力を開発するのに役立ちます。全体として、この研究は人工知能の分野における文化伝達と進化の理解を深め、人工エージェントが人間とのインタラクションを通じて効率的に学ぶ方法を提供します。
Google DeepMind
要は、AIが人間と同様に社会学習でスキルを習得できると主張し、そのための研究をしているということです。
ここから予想できるのは、AIに指示を出すプロンプトエンジニアリングから、AIを制御するためのプロンプトエンジニアリングの必要性が高まることになり得ます。
プロンプトエンジニアに必要なスキル
プロンプトエンジニアに必要なスキルは、以下の7つが代表的なものとして挙げられます。
- 自然言語処理(NLP)の知識
- モラル
- 言語化力・創造力
- プログラミングスキル
- 情報収集力
- SEO対策の知識
- クリエイティブセンス
自然言語処理(NLP)の知識
自然言語処理(NLP)とは、コンピュータが人間の言語を理解・処理できるようにするための技術です。
プロンプトエンジニアは、NLPの知識を使って、AIが理解しやすいプロンプトを作成する必要があります。
そのためには、さらに踏み込んで大規模言語モデル(LLM)の仕組みも理解する必要があります。
関連記事:LLM(大規模言語モデル)とは?活用方法やAIの課題も解説
モラル
基本的に、リリースされているモデルは学習により差別的な表現や危険な情報は出力しないようになっています。
しかし、プロンプトの勉強を進めると、その制限を解除するようなプロンプトを見ることになるでしょう。
割と簡単に発見できるので、初期段階でそのようなプロンプトと接触してしまいます。
それを使わない、使わせないこともプロンプトエンジニアの条件だと思います。
また、LLMも新しい言葉を覚えていくので、新しい差別的な表現などを学習しても、そのことに対してしっかりとブレーキをかけることも重要です。
個人でできることでもないかもしれませんが、そういう意識は必ず持っていないといけません。
さらに、画像・映像生成で特に言えることですが、実際の人物(亡くなった方や歴史上の人物を含む)をAIに憑依させるのはかなり気をつけないといけません。
言い出したらキリがないのであくまで一例ですが、以下のようなことは絶対にやってはいけません。
- 政治家や著名人を生成したフェイクニュースの作成・拡散
- 亡くなった方への冒涜
- 実在する方の顔と名前で意見を主張する
- 実在するクリエイターの盗作
悪意はなくても、歴史上の人物にアドバイスを求めたくなることもあるかと思います。
「孔子ならこういう時なんと言ってくれるだろう」「現在の状況をピカソに風刺画を書いて欲しい」「ボブ・マーリーに現代のレゲエリディムで歌って欲しい」などはおそらく尊敬からくる想いであって、悪意はないかと思います。
しかし、人によっては「歴史上の人物への冒涜」と思われる可能性もありますので、SNSなどに上げないのが一番ですが、プロンプトを使用した第三者が拡散する可能性もあります。
作成した目的や、AIを使用したことを明記するなど、最大限に気をつけなければなりません。
また、画像生成は、どうしても実在する画家やイラストレーターと画風が似ることがあります。
悪意があるのは論外ですが、悪意がなくても今後の法規制などの状況を見ながら、AIが作ったことを明記する、プロンプトごと同時に公開するなど、やはり気をつけなければなりません。
「盗作」と思われることや、実在するクリエイターの方に迷惑をかけてしまう可能性があります。
関連記事:【ChatGPT】逆にAIにバイアスを指摘してもらうプロンプト|例文付き・是非コピペ
言語化力・創造力
プロンプトエンジニアは、自分の頭の中のアイデアを正確に言語化できる必要があります。
また、AIがより良い出力を得られるように、創造的なプロンプトを作成できることも求められます。
言語化力を高めるには、日頃から読書や文章を書くことを意識しましょう。
また、さまざまな人の意見や考え方に触れることで、創造力を養うことができます。
さらに一歩進むと、さまざまな人の「こうなったらいいな」という意見を、すぐにプロンプトに変換する道筋を考えることが重要です。
これが英語でできるとなお良しです。
関連記事:ChatGPTの便利な使い方とは?プロンプトの例文も紹介
プログラミングスキル
AIの活用範囲が広がるにつれて、プログラミングのスキルも求められるようになってきています。
コードを書くのはAIにやらせるとしても、間違えたコードが出力された際に基礎知識がないと、どんどんずれた方向に進んでしまいます。
また、プログラミングを使ってAIの出力結果を解析したり、AIの学習データを作成したりすることもできるようになることも重要です。
とはいえ、プログラミング言語自体が多すぎるのでおすすめを2つ紹介します。
それは、JavaとPythonです。
使用頻度が高いJavaは単純に需要があります。
AIの作成したJavaのコードを手で微調整するのではなく、AIへの指示だけで完結させられるとよりスキルが向上します。
Pythonは使用頻度の多さに加え、AI関連のライブラリやフレームワークが豊富に用意されているため、プロンプトエンジニアとして活躍しやすい言語です。
関連記事:ChatGPTでプログラミングを行なうためのプロンプトを紹介
情報収集力
最新情報をキャッチし続けることもプロンプトエンジニアには必要です。
毎日のように進化し続けているAIですので、現在持っている知識は数ヶ月で時代遅れになってしまう可能性もあります。
毎日しっかりと情報を得て時代についていくことが、他の業種よりも顕著に求められます。
AI関連の話題だけでなく、トレンドや流行にも敏感でなければなりません。
「トレンド×AI」で何ができるかを考えるのもプロンプトエンジニアに求められるスキルです。
関連記事:ChatGPTはもう古い?時代遅れ?ビジネスで代わりに使えるAIを紹介!
SEO対策の知識
インターネットの検索で、コンテンツを上位表示させる「SEO対策」は需要が多いため、知識程度は身につけておいた方が良いでしょう。
基本的には、信頼できる正確な情報を提供できるコンテンツが優遇されるというのは変わりません。
プロンプトにより、AIが生成する回答の正答率を上げること、個性が出にくいAIのテキストで、どこで差をつけるかが重要になってきます。
関連記事:ChatGPTにSEO対策に強いコンテンツを一気に作成させる方法を紹介!(プロンプト例文付き)
クリエイティブセンス
テキストベースのAIだけでなく、画像生成の需要にも答えなければなりません。
画像生成プロンプトの需要、生成した画像の需要ともに非常に多く存在します。
さらに、音楽の生成、動画の生成もすでに一般化しつつあります。
これらには正解はないのが難しいところです。
他にも難点として、同じプロンプトから全く違う生成物が出てくることも多いですし、Stable DiffusionとDALL-Eなどの扱っているAIでプロンプトの考え方が微妙に違ったりとなかなか大変ではあります。
プロンプトテンプレートは大量にありますが、縛られすぎるとテキスト同様に個性がなくなり差がつかないので、自力で作成するスキルが必要です。
関連記事:プロンプト集「プロンプトパーク」とは?ChatGPTや他のサービスとも比較!
まとめ
プロンプトエンジニアは、AIの能力を最大限に引き出すことができる将来性も注目度も高い職種です。
優秀なプロンプトエンジニアになるには、最新のAI技術やプロンプト技術を学ぶことが重要です。
ぜひプロンプトのシェアや練習のためにも、プロンプトパークでプロンプトを作成してみてはいかがでしょうか。