Skip to main content

V1

DataX

CompTIA DataXは、急速に進化するデータサイエンス分野のコンピテンシーを検証する、経験豊富なプロフェッショナルのための最高レベルの認定資格です。DataXによって、複雑なデータセットの処理、データドリブン型ソリューションの実装、洞察力のあるデータ解釈によるビジネス成長の促進に関する専門知識を正確かつ自信を持って実証するスキルを身につけることができます。

Xpert DataX Certification

DataX (V1) 認定資格試験の出題範囲概要

数学と統計学(17%)

  • 統計的手法: t検定、カイ二乗検定、分散分析(ANOVA)、仮説検定、回帰指標、ジニ指数、エントロピー、p値、受信者動作特性/曲線下面積(ROC/AUC)、赤池情報基準/ベイズ情報基準(AIC/BIC)、混同行列の適用。
  • 確率とモデリング: 分布、歪度、尖度、不均一方差性、確率密度関数(PDF)、確率質量関数(PMF)、累積分布関数(CDF)、欠損、オーバーサンプリング、および層別化の説明。
  • 線形代数と微積分: 順位、固有値、行列演算、距離メトリック、偏導関数、連鎖則、および対数の理解。
  • 時間モデル: 時系列の比較、生存分析、および因果推論。

キャリアアップ — DataX 認定試験/トレーニングはこちらから購入いただけます。

モデリング、分析、成果 (24%)

  • EDA手法: 単変量解析および多変量解析、チャート、グラフ、特徴識別などの探索的データ分析(EDA)手法を使用します。
  • データの問題: スパース データ、非線形性、季節性、粒度、および外れ値の分析。
  • データエンリッチメント: 特徴エンジニアリング、スケーリング、ジオコーディング、およびデータ変換を適用します。
  • モデルの反復: 設計、評価、選択、および検証を実施します。
  • 結果の伝達: 視覚化の作成、データの選択、欺瞞的なグラフの回避、アクセシビリティの確保。

機械学習 (24%)

  • 基本概念: 損失関数の適用、バイアスと分散のトレードオフ、正則化、相互検証、アンサンブル モデル、ハイパーパラメーターの調整、およびデータ リーク。
  • 教師あり学習: 線形回帰、ロジスティック回帰、k最近傍(KNN)、ナイーブベイズ、およびアソシエーションルールの適用。
  • ツリーベースの学習: デシジョン ツリー、ランダム フォレスト、ブースティング、およびブートストラップ集計 (バギング) を適用します。
  • ディープラーニング: 人工ニューラルネットワーク(ANN)、ドロップアウト、バッチ正規化、バックプロパゲーション、ディープラーニングフレームワークについて説明します。
  • 教師なし学習: クラスタリング、次元削減、および特異値分解(SVD)の説明。

オペレーションとプロセス (22%)

  • ビジネス機能: コンプライアンス、主要業績評価指標 (KPI)、要件収集について説明します。
  • データ型: 生成されたデータ、合成されたデータ、および公開データについて説明します。
  • データ インジェスト: パイプライン、ストリーミング、バッチ処理、データ系列について理解します。
  • データラングリング: クリーニング、マージ、代入、およびグラウンドトゥルースラベリングを実装します。
  • データ サイエンスのライフ サイクル: ワークフロー モデル、バージョン管理、クリーン コード、単体テストの適用。
  • DevOps と MLOps: 継続的インテグレーション/継続的デプロイ (CI/CD)、モデル デプロイ、コンテナー オーケストレーション、パフォーマンス監視について説明します。
  • デプロイ環境: コンテナ化、クラウド、ハイブリッド、エッジ、オンプレミスのデプロイを比較します。


試験に備えましょう — トレーニングはこちらから購入いただけます。

データサイエンスの専門的応用( 13%)

  • 最適化: 制約付き最適化と制約なし最適化の比較。
  • NLPの概念: トークン化、埋め込み、用語頻度逆ドキュメント頻度(TF-IDF)、トピックモデリング、NLPアプリケーションなどの自然言語処理(NLP)技術について説明します。
  • コンピュータビジョン: 光学式文字認識(OCR)、物体検出、追跡、およびデータ拡張について説明します。
  • その他のアプリケーション: グラフ分析、強化学習、不正検出、異常検出、信号処理などの説明。
 

試験の詳細

  • 試験バージョン: V1

  • 試験番号: DY0-001

  • 配信開始: 2024年7月25日(英語試験)/2024年9月10日(日本語試験)

  • 設問数: 最大90問まで

  • 設問の種類: 多肢選択式とパフォーマンスベース

  • 制限時間:165分

  • 合格スコア: 合格/不合格のみ (スケーリングされたスコアなし)

  • 言語:英語、日本語

  • 推奨経験: データサイエンスまたは同様の役割における実務経験5年以上

  • 配信終了: 通常、配信開始より3年後(2027年を予定)

習得できるスキル

  • データ処理、クリーニング、統計モデリング、線形代数、微積分の概念など、数学的および統計的手法を適切に適用します。

  • 適切な分析およびモデリング手法を利用して、モデリング、分析、および成果について正当なモデルの推奨を行います。

  • 機械学習モデルを実装し、ディープラーニングの概念を理解して、データサイエンスの能力を向上させます。

  • データサイエンスの運用とプロセスを効果的に実装して、組織の目標をサポートします。

  • さまざまな分野におけるデータサイエンスの業界動向と専門的な応用について理解する。

最新情報を入手

自信を持って前進

学習の旅とキャリアの成長をサポートするための最新情報、洞察、限定オファーを入手してください。