みなさん、こんばんは。小寺です。
待望のAWS DataSync DiscoveryがGAになりました。

https://aws.amazon.com/about-aws/whats-new/2023/04/aws-datasync-discovery-general-availability/

どのようなサービスなのか?どんなときに活用できるのか?ベストプラクティスを含めてお伝えします!

AWS DataSync Discoveryとは

AWS DataSync Discoveryは2022年9月にパブリックプレビューとして発表されたサービスです。
DataSync Discovery を使用すると、オンプレミスのストレージパフォーマンスと使用状況が可視化され、AWS へのデータ移行の簡素化および加速に役立つ、自動レコメンデーションを受け取ります。
レコメンドの情報を移行プランの一部として活用することもできるのがメリットです。

というのも、オンプレからクラウド移行をご検討された方なら経験があるかと思うのですが、(もちろん、クラウド移行を支援されている方もです・・)
特に大規模で複雑なストレージを移行したいと思ったけど、やっぱり無理だと思ったなんて方もいるかもしれませんよね。コストの見積もり、移行を必要とするアプリケーションのデータ、どのクラウドストレージサービスを選べばよいのか?なかなか決めきれないといったケースにぴったりなのが、この DataSync Discoveryです。

AWS DataSync Discoveryを使ってみたい!

DataSync Discoveryを使うためには、まずオンプレ側にDataSync エージェントをデプロイする必要があります。
VMware ESXi、Microsoft Hyper-V、または Linux KVM 環境で実行される仮想マシンにエージェントを入れて、オンプレミスストレージに接続し、パフォーマンスメトリクスや時系列での容量使用率などの情報を自動的に収集します。
すでにオンプレとAWSをAWS Direct Connect接続などで十分なネットワーク接続がある場合は、Amazon EC2 インスタンスを立ててエージェントを実行できます。

収集した情報を使って、Amazon FSx for NetApp ONTAP、Amazon FSx for Windows File Server、Amazon Elastic File System(EFS)など、どのストレージサービスに移行すればよいか?をレコメンドしてくれます。

まずは、エージェントを入れた後、設定側からストレージシステムを追加します。エージェントは設定時のIPアドレスまたはホスト名と認証情報からストレージの接続を行います。大体5分程度かかる想定とのことです。

My Storage system connecting to DataSync - console screenshot
https://aws.amazon.com/jp/blogs/news/simplify-and-accelerate-your-data-migration-using-aws-datasync-discovery/より引用

ディスカバリージョブが実行されると、収集された情報は DataSync コンソールで確認できるようになり、また DataSync CLI や SDK を使用しても確認できるようになります。CloudWatchからディスカバリージョブのエラーが発生した場合にエラー検知ができます。

Performance charts showing IOPS peaks and Throughput peaks
https://aws.amazon.com/jp/blogs/news/simplify-and-accelerate-your-data-migration-using-aws-datasync-discovery/より引用

ジョブ完了時に自動的に、レコメンデーションが自動生成されます。レコメンドの内容には、AWSストレージサービスの構成と推定月額費用が含まれます。

大事なのは、あくまでレコメンデーションであるということです。レコメンドを100%信じるというよりは、検討の選択肢の一つとして、本当に移行先のサービスがニーズを満たしているのか?をよくよく考えることが重要です。

Example recommendation and estimates output from discovery job
https://aws.amazon.com/jp/blogs/news/simplify-and-accelerate-your-data-migration-using-aws-datasync-discovery/より引用

DataSync Discoveryがサポートするサービス

・Network File System (NFS) file servers
・Server Message Block (SMB) file servers
・Hadoop Distributed File System (HDFS)
・Object storage systems
・Amazon S3 buckets
・Amazon EFS file systems
・Amazon FSx for Windows File Server file systems
・Amazon FSx for Lustre file systems
・Amazon FSx for OpenZFS file systems
・Amazon FSx for NetApp ONTAP file systems
・AWS Snowcone devices
・Google Cloud Storage buckets
・Microsoft Azure Files
・Microsoft Azure Blob Storage (preview) ※2023/4 GA時点ではプレビューです。

DataSync Discoveryのメリット

DataSync Discoveryを使うといいことをまとめてみました。

・移行計画を簡単に
DataSync Discovery は、自動化されたデータ収集とレコメンデーション機能が特徴。
AWS へのデータ移行の計画立案にかかる時間、労力、およびコストを最小限に抑えられます。レコメンデーションを使用して予算計画を通知し、検出ジョブを再実行して、移行計画の精度アップもできます。

・データ移行の自動化
DataSyncを使用するとストレージ システムとサービスの間でネットワークを介してデータを簡単に移行できます。
DataSync は、データ転送プロセスの管理と、高性能で安全なデータ転送に必要なインフラストラクチャの両方をサポートできるサービスです。

・データのセキュアな転送
DataSync は、暗号化や整合性検証などのエンド ツー エンドのセキュリティが担保されるので安全な転送ができます。
DataSync はIAMロールを使ってAWS ストレージにアクセスします。また、Virtual Private Cloud (VPC) エンドポイントもサポートしているため、パブリック インターネットを経由せずにデータを転送することもできます。

・データの転送速度
DataSync は、専用のネットワーク プロトコルと並列マルチスレッド アーキテクチャを使用して、転送速度をアップさせています。
移行、分析と機械学習のための反復的なデータ処理ワークフロー、およびデータ保護プロセスが高速化されます。

・運用コストが削減できる
DataSync の定額のギガバイト単位の料金設定により、費用対効果の高い方法でデータを移行できます。
カスタム スクリプトを作成して維持したり、高価な商用転送ツールを使用したりする必要がなくなります。