アナリティクス エクセレンス シリーズ | レポート API を使用したシーケンスベースのコンタクト ID チャンク
Analytics Excellence Series | Sequence-Based Contact ID Chunking w/Reporting API
Analytics Excellence シリーズの詳細については 、メイン ページをご覧ください 。
Reporting API は、 Insightデータ ウェアハウスからの直接データ抽出をサポートし、高いパフォーマンスと安定性を確保しながら、意味のあるデータ アクセスを提供することに重点を置いています。大規模な連絡先データセットを管理するクライアントの場合、連絡先レベルのデータの粒度により、初期データ ロード (特に activityDetails エンドポイントをクエリする場合) で大量のデータが発生する可能性があります。大量のデータ ロードの管理に効果的であることが証明されている連絡先 ID チャンクを使用したアプローチを、皆さんの役に立つかもしれないので共有したいと思います。
実装の概要 - シーケンスベースの連絡先 ID チャンク化:
大規模なデータセットを管理するには、Contact ID を使用して、データを管理しやすい小さなチャンクに分割します。
境界の決定:最小および最大の連絡先 ID を取得して範囲を設定し、チャンク化プロセスの上限を確立することから始めます。この最大値に達すると、チャンク化プロセスは停止します。
最小/最大 ID を決定するには、次の API クエリを使用します。
最小連絡先IDを取得:
{{baseUrl}}/1/Contact?$select=contactId&$orderby=contactId asc&$top=1
最大連絡先IDを取得:
{{baseUrl}}/1/Contact?$select=contactId&$orderby=contactId desc&$top=1
将来の参照用に最大 ID 値を保存します。後続の ETL 実行では、この保存された最大 ID を下限として使用し、抽出を新しい最大値まで拡張します。
削除された連絡先や不明な連絡先を含める場合は、連絡先 ID -1 から抽出を開始します。
このアプローチに従うことで、API パフォーマンスを最適化し、大量の初期ロード抽出を正常に管理できます。