Posts

Object Basics

3. Object Basics Matt Zandstra (1) Brighton, UK Objects and classes lie at the heart of this book and, since the introduction of PHP 5 over a decade ago, they have been at the heart of PHP too. In this chapter, I establish the groundwork for more in-depth coverage of objects and design by examining PHP’s core object-oriented features. If you are new to object-oriented programming, you should read this chapter carefully....

第9章: RAGとエージェントを使用したコンテキスト認識推論アプリケーションこの章では、これまで学んだ知識を統合し、コンテキスト認識推論アプリケーションを構築する方法を探ります。そのため、検索拡張生成（RAG）とエージェントについて学びます。また、RAGとエージェントのワークフローの実装と保守を容易にするLangChain、ReAct、PALなどのフレームワークについても紹介します。RAGとエージェントは、多くの場合、生成AIアプリケーションの重要なコンポーネントです。 RAG: 知識の限界を克服する RAGでは、LLMの知識の限界に対処し、モデルの生成出力の関連性を向上させるために、関連情報をプロンプトのコンテキストに追加します。RAGは、新しいデータがシステムに届くたびにモデルを再トレーニングする必要なく、動的なデータソースをプロンプトコンテキストに組み込むことで、知識のカットオフや幻覚などの課題を効果的に軽減できるため、人気が高まっています。 RAGは、既存のファウンデーションモデルや、生成ユースケースとドメインに特化したファインチューニング済みモデルや人間が調整したモデルに統合できます。 RAGとファインチューニングは併用可能です。互いに排他的ではありません。 RAGの利点と欠点 RAGベースのアーキテクチャの利点は、継続的なファインチューニングを必要とせずに、外部データや動的データにアクセスできることです。これは、継続的なファインチューニングはコストがかかりすぎるため、大きなメリットです。また、RAGベースの手法は、既存のファウンデーションモデルを使用して実装されるため、多くのML専門知識を必要としません。ただし、RAGベースのアーキテクチャには、データソース接続の管理、外部データソースからのデータ取得、追加のデータ準備、プロンプト拡張などの追加の手順が必要になるという欠点もあります。これらの追加の手順は、レイテンシの増加と全体的なパフォーマンスの低下につながる可能性があります。また、RAGは生成モデルの重みを実際には変更しないことに注意する必要があります。ただし、これは多くの場合望ましいことなので、欠点とは見なされません。エージェント: 推論と行動の組み合わせエージェントは、ファウンデーションモデルを推論エンジンとして使用しながら、ユーザーのリクエスト、ファウンデーションモデル、外部データソース、アプリケーション間でプロンプト完了ワークフローを調整する追加のソフトウェア部品です。エージェントは、**ReAct（推論と行動）**というフレームワークを利用することが多く、これは、モデルに問題を推論し、解決策を見つけるための行動を決定する方法を示すために、思考の連鎖（CoT）推論を使用してプロンプトを構造化します。行動の一環として、エージェントはRAGワークフローでコンテキスト関連情報を検索したり、アプリケーションAPIを呼び出してタスクを実行したりできます。 LLMの限界大規模言語モデル（LLM）は、正確な知識と最新の知識に関するいくつかの課題を抱えています。このセクションでは、RAG手法で改善できるLLMの2つの一般的な問題である幻覚と知識のカットオフについて説明します。幻覚とは、モデルが自信を持って間違った回答を返すことです。たとえば、モデルは「snazzy-fluffykins」という架空の犬種について、誤った情報を含んだ説明を返す可能性があります。知識のカットオフとは、モデルが最新のデータと一致しない回答を返すことです。すべてのファウンデーションモデルは、トレーニングされた日付を知識のカットオフとして持ち、その日付以降のデータに関する情報は持ちません。たとえば、モデルに最近のNBAチャンピオンを尋ねると、2021年のチャンピオンに関する情報しか返せません。これは、モデルがトレーニングされたデータには、それ以降の情報が含まれていないからです。 RAGのワークフロー RAGは、LLMにトレーニング中に見ていないデータへのアクセスを提供するためのフレームワークです。RAGにより、LLMベースのアプリケーションは、外部データソースとアプリケーションを利用して、先ほど説明したような知識の限界を克服できます。 RAGは、LLMの「パラメトリックメモリ」に含まれていない追加のデータにLLMをアクセスさせたい場合に役立ちます。これは、組織の内部データストアからの独自情報など、元のトレーニングデータには存在しなかったデータです。モデルにこの情報へのアクセスを許可することで、モデルの完了の関連性を向上させ、幻覚の課題を軽減するのに役立ちます。知識のカットオフに対処するために、RAGはモデルのトレーニング日付を超えた最新のデータへのアクセスを許可します。この手法により、ドメイン固有の情報を含め、追加の情報をファウンデーションモデルに拡張できます。これは、継続的なファインチューニングなしに可能です。外部知識ソース RAGは、モデルに実行時に追加の外部データへのアクセスを提供することで機能します。このデータは、ナレッジベース、ドキュメントストア、データベース、インターネットで検索できるデータなど、さまざまなデータソースから取得できます。 RAGワークフローの詳細 RAGベースのアーキテクチャには、多くの場合、外部知識ソースからのデータ準備ワークフローなど、複数のコンポーネントが含まれます。高いレベルでは、外部知識ソースからのデータ準備と、そのデータを消費アプリケーションに統合する、2つの一般的なワークフローがあります。データ準備には、データソースの取り込みと、データソースを説明する重要なメタデータの取得が含まれます。これには、利用されている情報ソースの種類に固有のタスクが含まれる場合があります。たとえば、情報ソースがPDFの場合、これらのドキュメントからテキストを抽出する追加のタスクがあります。データが既に使用可能な形式になっている場合は、これが常に必要なわけではありません。ただし、データ準備は、RAGベースのアーキテクチャにおいて、データを取得のために準備するために、多くの場合前提となります。アプリケーション統合には、入力クエリに基づいて、意味的に最も類似した情報を取得することが含まれます。この情報は、後でRAGワークフローで使用され、LLMを呼び出す前に追加のコンテキストを使用して入力プロンプトを拡張します。ドキュメントの読み込み RAGベースのアーキテクチャはさまざまな情報ソースからデータを取得できますが、ここでは、ドキュメントからの情報取得に焦点を当てます。ドキュメントの検索と取得の一般的な実装には、各ドキュメントが埋め込みモデルによって生成された埋め込みベクトルに基づいてインデックス付けされたベクトルストアにドキュメントを保存することが含まれます。埋め込みベクトルには、ドキュメント内のテキストデータの数値表現が含まれています。各埋め込みは、データの意味的または文脈的な意味を捉えることを目指しています。ここでの考え方は、意味的に類似した概念は、ベクトル空間内で互いに近くに位置するというものです。その結果、情報取得には、入力クエリに基づいて、入力クエリと意味的に類似していると考えられる埋め込みベクトルを見つけることが含まれます。各埋め込みベクトルは、埋め込みベクトルが作成された元のコンテンツへの参照などの追加のメタデータとともに、ベクトルストアに格納されます。ベクトルストアは、さまざまなアプローチを使用してベクトルをインデックス付けします。このインデックス付けにより、ドキュメントを迅速に取得できます。ベクトルストアは、推論時に、入力クエリに基づいて外部情報を効率的に取得するために、プロンプトワークフローで使用されます。チャンク分割チャンク分割は、ドキュメントのインデックスを作成し、検索を行う際に使用される一般的な手法です。チャンク分割は、ドキュメントを、サイズが一定のテキストのチャンクに分割します。チャンクは、そのチャンク内で意味的に関連していて、意味のあるコンテキストを持つ情報を含む必要があります。チャンク分割には、さまざまな方法があります。たとえば、一定の数のトークンを使用してデータを分割する固定サイズチャンク分割を使用できます。これは、簡単な方法であり、計算効率が高いです。ドキュメントの取得と再ランキングドキュメントからテキストが埋め込まれ、インデックス付けされると、アプリケーションで関連情報を取得するために使用できます。RAGベースのアーキテクチャでは、取得された情報は、後でワークフローで使用され、LLMを呼び出す前に、追加のコンテキストを使用して入力プロンプトを拡張します。プロンプトの拡張関連するコンテキストデータが取得されると、RAGベースのワークフローの次のステップは、取得した追加のコンテキストを使用してプロンプトを拡張することです。 RAGのオーケストレーションと実装 RAGは、モデルを外部知識で拡張するためのフレームワークです。この章では、ドキュメントからの外部知識を組み込むRAGワークフローを例に挙げ、データ取得の準備、取得、再ランキング、プロンプト拡張を消費アプリケーションに統合する方法を説明しました。RAGベースのアーキテクチャを実装するには、さまざまな方法があります。このセクションでは、RAGワークフローをオーケストレーションするための特定の手法について説明します。 RAGベースのアーキテクチャをサポートし、RAGを実装するには、データ準備ワークフローなど、複数のコンポーネントが必要です。データ準備ワークフローには、取得のために最適化された形式でデータを読み込み、準備するために必要なタスクが含まれます。さらに、RAGをアプリケーションに統合するためのワークフローも必要です。 LangChain: RAGのオーケストレーションフレームワーク RAGをアプリケーション統合の一部として実装するには、入力プロンプトを埋め込み、関連するデータを取得し、プロンプトを拡張し、拡張されたプロンプトを使用してLLMを呼び出すなどの手順が複数必要です。これらの手順にはすべて、図9-8に示すように、必要なタスクをオーケストレーションできるコンポーネントが必要です。 LangChainは、コンテキスト認識推論アプリケーションとエンドツーエンドワークフローの開発をサポートするモジュール、インターフェース、統合で構成されています。これらのワークフローには、ドキュメントの読み込み、チャンク分割、さまざまなベクトルストアからの取得が含まれます。エージェントユーザーに旅行に関するアドバイスを提供し、航空券とホテルを予約できる生成AIベースの旅行アプリケーションを考えてみてください。このためには、ユーザーのリクエスト、ファウンデーションモデル、外部データソースとアプリケーション間でプロンプト完了ワークフローを調整するエージェントと呼ばれる追加のソフトウェア部品が必要です。エージェントは、ファウンデーションモデルを推論エンジンとして使用します。第2章で学んだ思考の連鎖（CoT）プロンプティングに基づいて、一部のモデルは、Web検索、SQLクエリ、Pythonベースの電卓スクリプトなどのツールによって実行される段階的な行動計画を生成できます。 ReAct: 推論と行動の構造化されたプロンプトエージェントは、モデルにユーザーのリクエストを推論し、段階的な行動計画を作成する方法を示すために、CoTプロンプトと類似した構造化されたプロンプトを自動的に構築します。エージェントは、外部システムから取得した情報を自動的にプロンプトに拡張して、モデルがよりコンテキスト認識的で関連性の高い完了を生成するのに役立ち、最終的な応答をユーザーに返します。エージェントの実装は、LangChainエージェントやHugging Face Transformersエージェントなど、多くの一般的なオープンソースライブラリで利用できます。AWSでは、Amazon Bedrockのエージェントなど、フルマネージドサービスを選択することもできます。 PAL: コードインタープリターの接続 CoTでは、モデルの算術やその他の数学演算を実行する能力は制限されています。生成ファウンデーションモデルは、数学を行っているのではなく、プロンプトを完成させるために最も可能性の高い次のトークンを予測しているだけです。この制限を克服するために、モデルをPythonインタープリターなどの計算に優れたアプリケーションに接続できます。**プログラム支援言語モデル（PAL）**フレームワークは、まさにこれを行います。 PALは、CoT推論を使用して、指定された問題を解決するのに役立つ中間推論ステップでプログラムを生成します。これらのプログラムは、インタープリター（たとえばPythonインタープリター）に渡され、インタープリターはコードを実行し、結果をファウンデーションモデル（FM）に返します。 FMOps: 生成AIプロジェクトライフサイクルの運用ますます多くの生成モデルが重要なアプリケーションを動かしています。その結果、これらのモデルを本番環境で構築、展開、運用するためのより信頼性が高く、効率的で、繰り返し可能なメカニズムを構築する必要性も高まっています。このセクションでは、生成AIワークロードを効率的かつ確実に配信するための重要な考慮事項を紹介します。この分野の用語は、まだ確立されていません。GenAIOps、FMOps、LLMOpsなどの用語が使われています。これらはすべて、既存のMLOpsの慣行を基にしています。実験の考慮事項実行可能なユースケースが特定された後、最初のステップは通常、既存のファウンデーションモデルを試して、先に進むための最良の候補を特定することです。このステップは、新しい最先端のモデルがリリースされるたびに、ユースケースのパフォーマンスを別のモデルで改善できるかどうかを判断するために、継続的に実行することも重要です。開発の考慮事項生成AIプロジェクトライフサイクルのこのステップでは、ターゲットタスクに対してパフォーマンスの高いモデルを作成または拡張することに重点が置かれます。...

Eloquent ORMの基本

Laravel Eloquent ORMは、Laravelフレームワークに組み込まれたオブジェクトリレーショナルマッパー（ORM）であり、データベースとのやり取りを、オブジェクト指向のインターフェースを通じて行うことができます。構文がシンプルでクエリ生成、リレーションシップの管理などが簡単にできます。モデルの作成以下のコマンドでモデルとデータベースマイグレーションファイルを作成します。モデルは、テーブルの各カラムに対応する属性と、データベース操作を行うメソッドを持っています。 php artisan make:model Share -m これによってapp/Models/Share.phpとapp/database/migrations/xxxx_create_shares_table.phpという二つのファイルが作成されます。xxxxには日付が入ります。 Share.phpにはほかのモデルとのリレーションシップなどを記述します。 <?php namespace App\Models; use Illuminate\Database\Eloquent\Factories\HasFactory; use Illuminate\Database\Eloquent\Model; use Illuminate\Database\Eloquent\Relations\BelongsTo; class Share extends Model { use HasFactory; public function company(): BelongsTo { return $this->belongsTo(Company::class); } } テーブルの定義はxxxx_create_shares_table.phpに記述します。 public function up(): void { Schema::create('shares', function (Blueprint $table) { $table->id(); $table->foreignId('company_id')->constrained()->onDelete('cascade'); $table->date('date'); $table->unsignedBigInteger('total_shares')->nullable(); $table->unsignedBigInteger('average_shares')->nullable(); $table->unsignedBigInteger('treasury_shares')->nullable(); $table->timestamps(); }); } 作成したモデルについて以下のように確認することができます。 php artisan mode:show Share Eloquentモデルの暗黙の約束事(conventions) テーブルの名前データベーステーブルの名前はモデル名によって決められます。クラス名の「スネークケース」で複数形にしたものがテーブル名として使用されます。Shareモデルのテーブル名がsharesに、FiscalYearモデルがあればテーブル名がfiscal_yearsとなります。上記の慣例に従っていない場合は、モデルクラスにおいてテーブル名を指定することができます。 class Share extends Model { protected $table = 'my_table_name'; } プライマリーキー(Primary Keys) 各モデルに対応するデータベーステーブルに id という名前のプライマリキーカラムが存在するのが約束事です。モデルに protected $primaryKey プロパティを定義することで、別のカラムを指定できます。そのほかに...

Filamentを使ったLaravelアプリの開発

FilamentについてLLMに聞くと以下のような回答が返ってきました。なかなか良さそうなので早速試してみます。 Filamentは、Laravel アプリケーションのためのオープンソースの管理パネル作成フレームワークです。簡単に言うと、Filament を使うと、わずか数行のコードで、美しく、機能的な管理パネルを構築できます。 Filamentを使うと以下のようなメリットがあります: 迅速な開発: Filament は、事前構築されたコンポーネントとテンプレートを提供することで、開発時間を大幅に短縮します。美しいデザイン: Filament は、洗練された UI と UX を提供し、ユーザーエクスペリエンスを向上させます。カスタマイズ性: Filament は、豊富なカスタマイズオプションを提供し、アプリケーションのニーズに合わせて管理パネルを調整できます。強力な機能: Filament は、ユーザー管理、認証、アクセス制御、データテーブル、フォーム、ファイルアップロードなど、管理パネルに不可欠な機能をすべて備えています。コミュニティサポート: Filament は、活発なコミュニティサポートがあり、質問や問題解決の支援を受けることができます。プロジェクト作成とFilamentインストール新しいLaravelプロジェクトを以下のように作成します。 composer create-project laravel/laravel companydb cd companydb .envのDB設定を書き換えます。 DB_CONNECTION=mysql DB_HOST=127.0.0.1 DB_PORT=3306 DB_DATABASE=companydb DB_USERNAME=root DB_PASSWORD=xxxx mysqlにcompanydbデータベースを新規作成し、migrationコマンドを実行します。 php artisan migrate filament DOCSに従ってFilamentのインストールをします。 composer require filament/filament:"^3.2" -W php artisan filament:install --panels php artisan make:filament-user ブラウザでhttp://127.0.0.1:8000/admin/にアクセスすれば作成したユーザとパスワードでログインできます。ログインすると以下のような画面が表示されます。データベースモデルを作成する Model::unguard()を追加 AppServiceProvider.phpにModel::unguard()を追加します。 /** * Bootstrap any application services. */ public function boot(): void { Model::unguard(); } Blueprintを使ってモデルを作成するモデルの作成はBlueprintというツールを使って行います。まず以下のようにインストールし、draft....

静的サイトジェネレーターHugoを使って、ブログサイトを作成してみる

Hugoは、Go言語で記述された高速で強力な静的サイトジェネレーターであり、シンプルながらも柔軟性があり、ブログ、ドキュメント、ポートフォリオ、企業ウェブサイトなど、様々な種類のウェブサイトを簡単に作成することができます。早速インストールして試してみますが、環境はWindows11のWSL上のUbuntuを利用します。 Hugoのインストール Hugoにはstandardとextendedという二つのバージョンがあり、お勧めのextended版をパッケージマネジャーsnapを使ってインストールします。詳しい説明はここ sudo snap install hugo サイト作成以下のコマンドを使って新しいサイトを作成します。--format yamlをつけることでHugo設定ファイルをYAML形式に指定します。デフォルトではTOMLになります。hugo.yamlがサイトの設定ファイルです。 hugo new site my-new-site --format yaml テーマの選択テーマに関しては、Hugoテーマサイトに様々なものがありますが、今回PaperModを使います。my-new-siteに移動してGithubにあるテーマをクローンします。将来テーマのアップデートはgit pullで行うことができます。 PaperModについてデモサイトに詳しい説明があります。デモサイトのmarkdownのソースコードはGithubにあり、勉強になります。 git clone https://github.com/adityatelange/hugo-PaperMod themes/PaperMod --depth=1 設定ファイルhugo.yamlの編集以下はサンプルの設定ファイルです。 baseURL: https://donsitnote.extendtech8.com/ title: Don's IT&Finance Notebook theme: hugo-PaperMod paginate: 5 enableInlineShortcodes: true pygmentsUseClasses: true # affect code display enableEmoji: true mainsections: ["posts", ] languageCode: 'ja' taxonomies: category: categories tag: tags series: series menu: main: - name: Archive url: archives weight: 5 - name: Search url: search/ weight: 10 - name: Tags url: tags/ weight: 10 outputs: home: - HTML - RSS - JSON params: env: production # to enable google analytics, opengraph, twitter-cards and schema....