人工知能と人間の精神の間の橋が、鉄鋼やコンクリートではなくコードとアルゴリズムで作られていると想像してみてください。これが ChatGPT API が提供するものです。それは単なるツールではありません。これは、会話アシスタントが人間の言語の複雑さに気づき、知的かつ適切に反応し、あらゆるやり取りから知識を得るのを助ける手段です。
OpenAI のサポートにより、ChatGPT API は高度な言語モデルをアプリに組み込み、会話作成や自然言語解釈などの機能でアップグレードするための強固な基盤を提供します。
アプリケーション プログラミング インターフェイス (API) は、2 つのソフトウェア アプリケーション間の通信を容易にし、特定の機能とデータを共有することで対話できるようにします。
たとえば、Instagram API では次のようになります。開発者 Instagram からユーザー プロフィール、リール、トレンドにアクセスし、この情報を使用するアプリを作成できるようにします。
同様に、OpenAI の革新的な会話型 AI モデルは、GPT-4、GPT-3.5、 そしてGPT-4 Turbo、特に、ChatGPT API を通じてアクセスできます。このアクセスにより、開発者はアプリケーションでこれらの強力な言語モデルを使用できます。
テクノロジーの進歩に伴い、ソフトウェア開発における API の重要性が明らかになってきています。開発者が現在のプラットフォームの機能を拡張できるようにし、新しい機能を迅速に開発しやすくすることで、イノベーションを促進します。
動的で応答性が高く、機能が豊富なアプリケーションを設計するには、開発者は API 統合についてしっかりと理解しておく必要があります。これを使用して、仮想アシスタントやチャットボットを構築して、対話型のユーザー対話を促進し、顧客サービス手順を自動化し、記事、レポート、電子メールなどのコンテンツを生成し、特定の分野の質問に応答することができます。
ChatGPT API の使用開始: 必須の要件と手順
ChatGPT API を効率的に使用するには、いくつかの重要な要素と手順を準備し、認識しておく必要があります。
ステップ01: OpenAIアカウント登録
OpenAI アカウントを作成します。API キーを取得して API にアクセスできるかどうかは、これに依存します。登録後に API キーを見つけるには、次のサイトにアクセスしてください。APIエリアOpenAI アカウント ダッシュボードの。これらのキーは、ChatGPT API へのリクエストを認証するために必要です。
ステップ 02: 技術的要件
Python、JavaScript、または HTTP リクエストを送信できるその他の言語などのプログラミング言語を理解することが不可欠です。
Python と cURL の例は OpenAI API ドキュメントに含まれているため、Python は開発者の間で好まれる言語です。
コンピューター上に適切な開発環境をセットアップします。これは、コマンド ライン インターフェイスを備えたテキスト エディター、または PyCharm や Visual Studio Code などの統合プログラミング環境 (IDE) である場合があります。
使用できますOpenAI の公式 Python バインディング、公式 Node.js ライブラリ、公式HTTPリクエストどの言語からでも、またはコミュニティが管理する図書館API と通信します。
次のコマンドを使用して、公式の Python バインディングをインストールします。
(pip インストール openai )コマンドを実行してください
公式 Node.js ライブラリをインストールするには、Node.js プロジェクト ディレクトリで次のコマンドを実行します。
('npm install openai@^4.0.0') コマンドを実行して、OpenAI ライブラリのバージョン 4.0.0 以上をインストールします。
ステップ 03: API ドキュメント
を勉強してくださいOpenAI API のドキュメント詳細に。これには、使用できるパラメーター、API にクエリを送信する方法、およびどのような種類の応答が期待されるかについての重要な詳細が含まれています。
ステップ 04: 技術的なセットアップ
開発環境が送信できることを確認してくださいHTTPリクエスト。Python のリクエストなど、特定のライブラリまたはパッケージのインストールが必要になる場合があります。
セキュリティ上の理由から、API キーをプログラムにハードコーディングするのではなく、環境変数に保存することをお勧めします。
ステップ 05: 学習と実験
どれだけ違うかを知るにはAPI設定パラメータは応答に影響を与えるため、テストする準備をしてください。この実践的な経験は、ChatGPT API を効率的に使用する方法を理解するのに役立ちます。
クエリを効果的に管理し、予期せぬコストを防ぐには、API のレート制限についてよく理解し、使用制限。
ステップ 06: プライバシーとセキュリティに関する懸念
API キーを公開または共有コード リポジトリに決して公開しないでください。常に彼らを安全に保ちます。主に API を使用してプライベート データや機密データを処理する場合は、データ プライバシーの規則と規制に注意し、遵守してください。
API をプロジェクトに統合する
プロジェクトに API を含めることで、アプリケーションをより機能的、効率的、スケーラブルにすることができます。API を使用すると、ユーザー インターフェイスを必要とせずに、いくつかのソフトウェア プログラムが相互に対話し、データを共有し、タスクを実行できます。
高度なソフトウェア システム、Web サービス、モバイル アプリのいずれを作成する場合でも、API は他のデータやサービスを活用し、プロセスを自動化し、アプリケーションの機能を強化するための適応可能な手段を提供します。
API を作成していない場合は、次のサイトにアクセスしてください。OpenAIのWebサイトそしてアカウントを作成する。API キーを表示するには、アカウント ダッシュボードの API 領域に移動します。これらのキーは、API へのリクエストを認証するために必要です。
API との通信に必要なハードウェアがコンピューターにあることを確認してください。これは、次のものが必要であることを意味します。
- プログラミングのセットアップ: Python などの Web リクエストを送信するようにプログラミング言語を構成します。
- 必要なライブラリ: これらのリクエストの送信を簡単にするには、Python のリクエストなどの特殊なコード パッケージをインストールします。
これは「テスト API キー」を生成するために必要です。これは、正確なデータを損なったり、不必要な費用を追加したりすることなく、アプリケーションが API とどのように対話するかを安全にテストおよび検証するために不可欠です。
ChatGPT サービスへの API 呼び出しを行うには、好みのプログラミング環境でスクリプトを構築します。ここでは、リクエスト ライブラリを使用する簡単な Python の例を示します。
インポートリクエスト
# 'your_api_key_here'を実際のOpenAI APIキーに置き換えてください
ヘッダー = {
"Authorization": f"Bearer your_api_key_here", # 認証用のヘッダー
"Content-Type": "application/json", #コンテンツタイプをJSON形式に設定
}
データ = {
"model": "gpt-3.5-turbo", # 使用するモデルを指定
"messages": [{"role": "user", "content": "OpenAI の使命とは何ですか?" }], #ユーザーの役割と質問内容
}
# APIにリクエストを送信して応答を得る
応答 = request.post("https://api.openai.com/v1/chat/completions", headers=ヘッダー, json=data)
# 応答をJSON形式で出力
print(response.json())
このスクリプトは、「OpenAI ミッションとは何ですか?」というプロンプトに基づいて応答を生成するように ChatGPT API に要求します。
ChatGPT API にアクセスするコードに API キーを挿入した後、ロボットが API を作成しているのではないことをシステムが認識できるように、検証プロセスを受けることが重要です。
キーをコピーして安全な場所に貼り付けて保存します。プライバシーとセキュリティを維持して、他の人があなたの OpenAI アカウントにアクセスするのを防ぎます。
APIからのレスポンスはJSON形式となります。スクリプトはこの回答を解析して、作成されたテキストを含む必要なデータを取得する必要があります。
基本的なリクエストに API を使用することに自信が持てるようになったら、次のような高度な機能を試してみることができます。
- 温度を変更すると、出力の予測不可能性を管理するのに役立ちます。
- max_tokens 引数を使用して、生成される応答の長さを制限します。
- 多くのモデルを試して、どれが要件を最も満たすかを確認してください。
さまざまな分野のAPI
チャット完了 API のテキスト生成モデル
OpenAI のテキスト生成モデルは、自然言語、コード、画像を理解できます。これらのモデルには、事前トレーニングされた生成トランスフォーマー、GPT-4 および GPT-3.5-turbo が含まれます。
これらのモデルを利用するには、API キーと入力プロンプトを使用して OpenAI API リクエストを送信します。応答としてモデルの出力を受け取ります。
これらのモデルの主な機能の 1 つは、チャット完了 API です。これは、メッセージのリスト (それぞれに「ユーザー」、「システム」、または「アシスタント」などの特定の役割が付いています) を入力として受け取り、モデルによって生成されたメッセージを出力します。 。モデルのメモリ保持力が低いため、この API は、すべてのリクエストで関連する会話履歴を提供する必要があるため、コンテキストを認識した対話を必要とするアプリにとって特に重要です。
チャット完了 API の使用:
- メッセージのリストを入力として受け取り、モデルによって生成されたメッセージを返します。
- マルチターンの会話やシングルターンのタスクに適しています。
- API 呼び出しの例:
輸入オープンアイ
# OpenAIライブラリをインポートし、APIキーでクライアントを初期化
client = openai.OpenAI(api_key='あなたのAPIキーをここに入力')
# Chat APIへのリクエストを作成し、モデルを選択(ここでは「gpt-3.5-turbo」)し、メッセージのリストを指定
応答 = client.chat.create(
モデル="gpt-3.5-ターボ",
メッセージ=[
{"role": "system", "content": "あなたはアシスタントアシスタントです。"},
{"role": "user", "content": "2020年のワールドシリーズの勝者は誰ですか?"},
{"role": "アシスタント", "content": "2020年のワールドシリーズはワイド・ドジャースが勝ちました。"},
{"role": "user", "content": "それはどこで行われましたか?"}
】
)
#APIからの応答(モデル生成メッセージ)を出力
印刷(応答)
このコード スニペットでは、OpenAI の Chat API を使用して、GPT-3.5-turbo モデルとのチャット セッションを作成します。これには、会話のフローが含まれており、各メッセージには役割 (「システム」、「ユーザー」、または「アシスタント」) と対応するコンテンツがあります。
API は、この入力に基づいて応答を生成します。忘れずに交換してください‘あなたのAPIキーをここに入力’実際の OpenAI API キーを使用してください。
OpenAI の Audio API による Speech-to-Text 機能
OpenAI の最先端の大規模 v2 Whisper モデルは、Audio API の 2 つの音声テキスト変換エンドポイント (文字起こしと翻訳) を強化します。これらにより、さまざまな機能が可能になります。
- 転写:音声を話されている言語に書き写します。
- 翻訳:音声を英語に翻訳して文字に起こします。
このサービスでは、mp3、mp4、mpeg、mpga、m4a、wav、webm などのさまざまな形式での最大 25 MB のファイルのアップロードがサポートされています。
openaiインポートからOpenAI
# OpenAIライブラリをインポートし、クライアントを初期化
クライアント = OpenAI()
# 音声ファイルを開く
audio_file = open("/path/to/file/audio.mp3", "rb")
#トランスクリプションAPIを使用して、音声ファイルをテキストに変換
トランスクリプト = client.audio.transcriptions.create(
model="whisper-1", #使用するモデルを指定
file=audio_file #変換する音声ファイル
)
デフォルトの応答は、生の文字起こしされたテキストを含む JSON です。
文字起こし API の追加オプション
API 応答をカスタマイズするには、「response_format」などの追加パラメータを設定します。
openaiインポートからOpenAI
# OpenAI ライブラリをインポートし、クライアントを初期化します。
クライアント = OpenAI()
# オーディオファイルをバイナリ読み取りモードで開きます。
audio_file = open("speech.mp3", "RB")
# 音声トランスクリプションAPIを使用して、音声ファイルをテキストに変換します。
# 使用するモデルを「whisper-1」に指定し、ファイルを指定し、応答形式を「text」に設定します。
トランスクリプト = client.audio.transcriptions.create(
モデル = "ささやき-1",
ファイル=オーディオファイル、
応答形式="テキスト"
)
音声の翻訳例
openaiインポートからOpenAI
# OpenAI ライブラリをインポートし、クライアントを初期化します。
クライアント = OpenAI()
# ドイツ語の音声ファイルをバイナリ読み取りモードで開きます。
audio_file = open("/path/to/file/german.mp3", "rb")
# 音声翻訳APIを使用して、音声ファイルを英語のテキストに変換します。
# 使用するモデルを「whisper-1」に指定し、ファイルを指定します。
トランスクリプト = client.audio.translations.create(
モデル = "ささやき-1",
ファイル=オーディオファイル
)
転写および翻訳サービスは、アフリカーンス語、アラビア語、中国語、フランス語、ドイツ語、日本語などを含む多数の言語をサポートしています。モデルのトレーニングには 98 の言語が含まれていますが、単語の誤り率50% 未満の (WER) がリストされ、より高い精度が得られます。
OpenAIのDALL E APIを使用した画像の生成と操作
OpenAI の DALL·E は、革新的な画像生成および操作モデルであり、API を通じてさまざまな機能を提供し、画像の作成および編集方法を変革します。
オリジナル画像の生成
DALL・E APIを使用して、プロンプトに基づいてオリジナルの画像を作成します。DALL・E 3 では、最大 1024×1024、1024×1792、または 1792×1024 ピクセルの画像サイズがサポートされています。HD または標準品質はオプションです。DALL・E 2 では、n パラメーターを使用して最大 10 個のイメージが有効になりますが、DALL・E 3 では、リクエストごとに 1 つのイメージのみが許可されます (複数の並列リクエスト)。
画像生成例
openaiインポートからOpenAI
# OpenAI ライブラリをインポートし、OpenAI クライアントを初期化します。
クライアント = OpenAI()
# DALL-E 3モデルを使用して、テキストプロンプトから画像を生成するAPIを呼び出します。
応答 = クライアント。画像。生成する(
model="dall-e-3", #使用するモデルを指定
プロンプト="黒いシャム猫", #画像化テキストプロンプト
size="1024x1024", #画像サイズの指定
quality="standard", #画像の品質を指定
n=1, # 生成する画像の数
)
#応答から生成された画像のURLを取得
image_url = 応答.データ[0].url
元の画像を編集する
画像と置き換える領域を示すマスクをアップロードして、画像を編集または拡張します。プロンプトでは、新しいイメージ全体を説明する必要があります。アップロードされた画像とマスクが 4MB 未満の正方形 PNG であることを確認してください
画像の編集例
openaiインポートからOpenAI
# OpenAI ライブラリをインポートし、OpenAI クライアントを初期化します。
クライアント = OpenAI()
#DALL-E 2モデルを使用して、指定された画像を編集するAPIをアップロードします。
応答 = client.images.edit(
model="dall-e-2", #使用するモデルを指定
image=open("sunlit_lounge.png", "rb"), #編集する画像ファイルを開く
Mask=open("mask.png", "rb"), #編集に使用するマスクファイルを開く
プロンプト="日当たりの良い室内のラウンジエリアと、フラミンゴがいるプール", #画像の新しい説明
n=1, # 生成する画像の数
size="1024x1024" #画像サイズの指定
)
#応答から生成された画像のURLを取得
image_url = 応答.データ[0].url
黒シャム猫の編集版
OpenAI の DALL E API は、画像の作成と編集のプロセスを変革し、前例のないレベルの創造性と革新を可能にします。
DALL E は、バリエーションの作成、既存のビジュアルの変更、テキスト プロンプトに基づいた画像の作成など、さまざまなクリエイティブ ニーズを満たすツールを提供します。API を利用するときは、実際の OpenAI API キーを「あなたの API キーをここに入力」に置き換えることを忘れないでください。
GPT-4 のビジョン機能を使用した画像の理解と生成
OpenAI の最新の開発により、GPT-4 の機能が拡張され、単純な構文とコードに加えて、画像を解釈して操作する機能が追加されました。
GPT-4 with Vision (API では gpt-4-vision-preview と呼ばれることもあります) は、画像の処理、画像に関する問い合わせへの応答、および大量のデータの処理により、テキストのみの入力モダリティよりも大幅に進歩しています。
Chat Completions API を使用すると、GPT-4 にアクセスできる開発者が写真を入力できるようになり、視覚的なコンテキストを考慮したマルチモーダルな問題解決アプローチへの扉が開かれます。これは、ビジュアル データとインターフェイスする必要があるアプリケーションにとっては最高の機会です。
開発者は、API リクエストで Base64 エンコードされたデータを渡すか、画像への直接リンクを渡すかを選択して、画像入力をすぐに開始できます。これにより、API でさまざまなメッセージ形式の画像を処理できるようになり、さまざまな動的で応答性の高いアプリケーションの可能性が開かれます。
GPT-4 のビジョンを使用して画像の内容を理解する方法の例
openaiインポートからOpenAI
# OpenAI クライアントをあなたの API キーで初期化します。
client = OpenAI(api_key='あなたのAPIキーをここに入力')
# GPT-4 Visionモデルを使用して、画像の内容を理解するためのチャットを作成します。
応答 = client.chat.create(
モデル="gpt-4-vision-preview",
メッセージ=[
{
"ロール": "ユーザー",
"content": "この画像には写っていますか?",
"画像": "https://example.com/image.jpg"
}
】
)
# APIからの応答を出力します。
print(response.choices[0].message.content)
このコードは、GPT-4 と Vision を使用して画像を分析し、その内容のテキスト説明を出力します。これは、人工知能 (AI) が視覚データと言葉の間のギャップを埋めることによって、人々のデジタル情報とのやり取りや使用方法をどのように改善するかを示しています。この機能を利用するには、実際の OpenAI API キーを「あなたの API キーをここけ入力」に置き換えることを忘れないでください。
ChatGPT APIのコスト
ChatGPT API は別料金であり、ChatGPT Plus メンバーシップの一部ではないことに注意してください。API のコストは次の場所で入手できます。https://openai.com/pricing。月額 2,937 円の ChatGPT Plus サブスクリプションは、chat.openai.com での使用に限定されています。
よくある質問 (FAQs)
ChatGPT API を使用してカスタマー サポート ソリューションを作成することはできますか?
はい、ChatGPT API は、コンテンツを提供し、顧客サービス プロセスを自動化し、対話型のユーザー コンタクトを促進できるチャットボットと仮想アシスタントを作成するために使用できます。
ChatGPT API を使用する場合に制限はありますか?
使用制限、レート制限、および機密データまたは個人データのプライバシー法によるデータの処理方法に制限がある場合があります。
ChatGPT Plus と ChatGPT API の違いは何ですか?
開発者は、ChatGPT API をアプリケーションに組み込むことができます。これは、別のコスト構造を持つ独立したサービスです。これは ChatGPT Plus サブスクリプションには含まれておらず、ChatGPT Web サイトでの個人使用を目的としています。
複雑な状況に応じた会話を管理するための ChatGPT API のアプローチは何ですか?
ChatGPT API は、各 API 呼び出しのコンテキストを追跡し、複雑な複数ターンの会話を処理できるようにします。モデルが論理的で適切な回答を生成するには、開発者はすべての関連情報を含むように入力メッセージを編成する必要があります。
OpenAI は、ChatGPT API を使用する開発者にどのような支援を提供しますか?
OpenAI は、コミュニティ フォーラム、広範なドキュメント ポータル、API に関する質問や技術的な問題について開発者を支援するサポート スタッフを提供します。また、ベスト プラクティス ガイド、コード例、チュートリアルなどのリソースも提供します。