AWS re:Invent 2024が終了!注目の新サービスまとめ

公開日:2025年1月8日最終更新日:

AWSでは頻繁にサービスの新提供や更新が実施されています。クラウドサービスの中でも、更新頻度が高く、この点をAWSの魅力だと感じる人が多いでしょう。

定期的に新サービスの提供が続いていますが、re:Invent2024ではより多くのサービスが発表されました。今回は新しく発表されたサービスや追加機能の中でも、特に注目したいと考えるものをピックアップして解説します。

生成AIや機械学習

Amazon Bedrock Knowledge Basesのアップデート

プレビュー版の機能ではありますが、Amazon Bedrock Knowledge BasesでRAGの評価機能が利用できるようになりました。S3に入力と正解の組み合わせデータセットを保存すると、その内容を踏まえて、RAG評価を実施できます。

これまで、RAG評価を利用するためには、ユーザが細かな設定を施すかAWS公式以外の製品を導入することが求められました。しかし、今回追加された機能を活用することで、RAGモデルの活用を公式サービスで完結できるようになります。プレビュー版であり、詳細が変更される可能性は大いにありますが、業務を効率化したり信頼性を高めたりできるでしょう。

Amazon Q Developerによるドキュメント自動生成

Amazon Q Developerがアップデートされ、VSCodeなどの統合開発環境から呼び出せる機能が強化されました。特に、今回はAIと会話をしながら、基本的なドキュメントを自動生成できるようになっています。例えば、プロジェクトの内容を踏まえて、READMEなどのドキュメントを生成してくれるのです。

また、単にテキストドキュメントを作成するだけではなく、ブロックや見出しも適切に利用してくれることが魅力です。人間が作成した場合と遜色ないような内容を提示してくれるため、プロジェクト管理の効率を大きく高めてくれます。

Amazon Novaシリーズモデルの公開

Amazon BedrockにAmazon Novaと呼ばれる新シリーズモデルが登場すると発表されました。バージニア北部リージョンのみで利用可能ですが、以下のモデルを利用できます。

  • ・Nova Reel:最大で6秒の短い動画を生成できるモデル
  • Nova Pro:マルチモーダルでテキスト、画像、ビデオに対応できるモデル
  • Nova Lite:マルチモーダルでコストを抑えて気軽に利用できるモデル
  • Nova Micro:テキストを推量できる軽量なモデル
  • ・Nova Canvas:画像生成や編集に対応したモデル

マルチモーダルでも2種類のモデルが用意されているなど、生成する内容や処理速度の違うものが5種類用意されています。どのような用途でモデルを利用するかによって最適な選択が異なるため、利用のたびに判断するようにしてください。ProとLiteでは処理速度などに違いがあるため、その点も考慮して選択することが重要です。

Rerankモデルの公開

Amazon Bedrockは他にもモデルを追加し、Rerankモデルと呼ばれるものも登場しています。この新しいモデルの特徴を簡単に述べると、セマンティック検索の課題を解決できることです。

そもそも、セマンティック検索とは、検索クエリと文章を意味的に関連付ける検索方式を指します。これにより単語自体が一致していなくとも、意図する検索結果を得られるのです。現代では類似した言葉が検索結果に表示されることが多く、当たり前に感じているでしょう。

しかし、場合によってはまったく関連性のない内容が表示され、これは検索の限界があると考えられていました。そこで、Rerankモデルのようなものが研究され、ついに公開されるに至っています。

新たなものが登場したことで、セマンティック検索で得た結果の中から、機械的な基準で優先順位をつけられるようになりました。今までは優先順位を付けられず、関連性が低いものも表示されていましたが、今後はより関連性が高いものから表示できるようになるのです。

Amazon Bedrockのインターフェース最適化

Amazon Bedrockのサービスが強化され、新しく「latency-optimized inference」が発表されました。その名のとおり最適化されたインターフェースであり、標準モデルと比較すると大幅にレイテンシーを軽減できます。利用できる環境は米国東部 (オハイオ) リージョンの Anthropic の Claude 3.5 Haiku と Meta の Llama 3.1 405B および 70Bと限られていますが、大量のデータを扱う際は検討してみて良いでしょう。

特に、新しいインターフェースを利用することで、AIの応答速度が大幅に短縮されると考えられます。一般的に、応答速度はユーザーの利便性や快適性を大きく左右するため、コストが許すならば検討すべきサービスです。ただ、AWSの公式ブログでも具体的な短縮度合いは示されておらず、実際に使ってみて評価しなければなりません。

ストレージ

AWS Data Transfer Terminalの公開が開始

AWSの拠点を訪問し、物理的にデータ転送するサービスが登場しました。今まで自身のデバイスをAWSへ送付してデータを保存してもらうサービスはありましたが、こちらはユーザーが直接出向いていくことが特徴です。事前にAWSへの訪問日時を予約しておき、そのタイミングで訪問とデータ転送を済ませます。

しかし、残念ながらサービスが提供されているのは、現時点でロサンゼルスとニューヨークのみです。データ転送のために訪問できる拠点がこれらにしかないため、やむを得ないでしょう。これから拡大すると発表されているため、将来的には東京でも利用できると考えられます。また、何かしらの理由でロサンゼルスとニューヨークを訪問する可能性があるならば、そちらでデータを転送し、東京リージョンへ移動させるなどの選択肢もあります。

AWS Transfer Family web appsの公開

AWS Transfer Familyの新機能が発表され、Webブラウザ経由でS3にアクセスしやすくなりました。Webアプリを開発することで、ファイルのアップロードやダウンロードがスムーズに実施できます。これまでS3へのアクセスはいくつかの障壁を抱えていましたが、Webアプリ化することによって大きく改善できるのです。

しかも、Webアプリは自分自身で開発する必要がなく、AWS Transfer Family web appsからUIで簡単に作成できます。事前にIdentity Centerでユーザーやグループを作成しておく必要はあるものの、ほぼ負担はないと考えてよいでしょう。簡単な作業でWebアプリケーションをデプロイし、エンジニア以外のユーザーにもS3を公開しやすくなります。

Amazon S3 Tablesの新公開

現在、S3には2種類のバケットが存在し「汎用バケット」「ディレクトリバケット」と呼ばれています。そしてこれに追加する形で、「テーブルバケット」と呼ばれる3つ目のバゲットが公開されました。

その名のとおり表形式に特化したストレージで、データを取得するクエリのパフォーマンス向上やトランザクション数の増加に対応しています。主に分析作業のデータを格納することを想定していて、スナップショット管理などにも対応する見込みです。

なお、分析に特化したS3で、呼び出し元はAthenaやRedshiftなどのサービスが想定されています。現状はやや制限がありますが、将来的に機能拡張され、利便性が高まるでしょう。

コンピューティングやデータベース

P5enインスタンスの一般公開

東京リージョンでは提供されていなかったEC2の「P5en」インスタンスが一般公開されました。従来よりP5eと呼ばれるインスタンスは提供されていますが、これよりもCPUとGPU間のデータ転送速度が向上しています。具体的にはNVIDIA H200 Tensor Core GPUが搭載されていて、ネットワーク面で非常に強化されたインスタンスに変化しました。

非常にハイスペックなEC2インスタンスであるため、時間単価は106ドルと高額に設定されています。今後、少しは価格が抑えられるかもしれませんが、現状はコスト面には注意した方が良いでしょう。輸出管理などの都合で、日本国内にデータを保存することが強いられる場合などに、活用を検討してみてください。

Amazon Auroraのモニタリング機能が強化

RDSの中でも「Amazon RDS/Aurora」には「Performance Insight」と呼ばれるモニタリング機能が存在します。現時点で利用している人は多いでしょう。しかし、これをさらに強化したサービスとして、新しく「Database Insights」が登場しました。これまで、モニタリング内容を評価するためには、Performance InsightとCloudWatch Logsなどをユーザーが自分自身で行き来することが求められていました。しかし、新サービスが登場したことによって、これらを一元管理できるようになっています。

セキュリティ

Amazon GuardDutyのアップデート

AWSのセキュリティ対策で必須ともいえる「Amazon GuardDuty」がアップデートされました。具体的には「Amazon GuardDuty Extended Threat Detection」と呼ばれるもので、複数のイベントを集約できるようになっています。また、集約した結果を同一のイベントとして管理できるものです。今までは、それぞれ独立したイベントとして管理しなければなりませんでしたが、関連するものが自動的に集約・管理できます。

一般的に何かしらの脅威が発生した際、それぞれのイベントは独立したものではありません。例えば、不正にログインされ、その後、EC2が停止されるなどの流れがあるはずなのです。今までは、この流れを検討する必要がありましたが、機能追加で自動的に集約してもらえます。

まとめ

re:Invent2024ではAI関連のサービスを中心として、新しいサービスがいくつも登場しました。AWSは新サービスの多さが魅力でもあるので、キャッチアップして積極的に活用してみましょう。ただ、プレビュー版については変更が生じる可能性があるため、その点は注意が必要です。

クラウドの運用代行や導入、開発は23年の実績をもつジードにご相談ください

  • クラウドの運用代行

    クラウドの監視・保守・運用の代行 お客様が運営するクラウドの監視・保守・運用業務を、ジードが代行いたします。

    サービスの詳細はこちら

  • クラウドの設計・構築

    クラウドの設計・構築 お客様のご要望に沿って、適切なクラウド選定から設計・構築までを行います。

    サービスの詳細はこちら

  • クラウド上でのシステム開発

    クラウドの設計・構築 Azure上で、AI + 機械学習、分析、ブロックチェーン、IoTを開発します。

    サービスの詳細はこちら

お問い合わせ・お見積もりのご依頼はお気軽に

トップへ戻る