Skip to main content

データスキルのギャップを埋める

本サイト上のコンテンツは、参照目的だけのために、英語の原本から翻訳されたものです。また、本サイト上のコンテンツの一部は機械翻訳されたものです。日本語版と英語版の間に何らかの齟齬がある場合には、英語版が優先されます。当社は改善のためのあらゆる努力を行いますが、翻訳の正確性及び信頼性は保証せず、当社に故意または重大な過失がある場合を除き、不正確性又は遺漏により生じる損失又は損害に責任を負わないものとします。

紹介

デジタル経済におけるデータの重要性については、多くのことがなされてきました。デジタルデータは明らかに何十年も前から存在してきましたが、人工知能、予測分析、顧客のパーソナライゼーションの時代において、デジタルデータはより優先事項となっています。データはビジネスの「新しい通貨」および「新しい石油」と呼ばれており、運用構造全体を支えるほど重要な資産です。しかし、データに価値が与えられているにもかかわらず、企業はまだデータ規律とスキルを構築する初期段階にあります。

今日のビジネスにとってデータが重要なのはなぜですか?簡単に言えば、データ管理の不備やデータ分析の不備が収益に影響を与えています。組織はデータを収集してきましたが、通常、包括的な運用アプローチや必要なスキルへの焦点はありませんでした。これは、知性のない豊かさにつながりました。ほとんどの企業は、すべての部門にデータサイロ化を抱えており、企業データの全体像を構築する能力が制限されています。ソーシャルメディアやスマートデバイスなどの新しいソースからデータが流入していますが、このデータをビジネス上の意思決定に変換するための構造はありません。歴史的記録は豊富にありますが、これらの記録を使用して将来の計画を構築するための専門知識が明らかに不足しています。

research_closing-the-data-skills-gap_2.png

企業は、データ管理の不備やデータ分析の不十分さの影響を感じ始めています。その中でも最も重要なのは時間の無駄です。組織のさまざまな部分が必要なデータを探す必要があるため、コア機能や新しいイノベーションに集中するために使用できる時間が消費されます。テクノロジーのもう一つの共通の目標である効率の向上は、適切に設計されたシステムとワークフローの結果としてもたらされます。データ管理と分析は、特定の目的のためのポイントツールではなく、包括的なプログラムとして扱われるべきです。

ほとんどのテクノロジートレンドと同様に、データを優先度の高いものとして認識しても、自動的に機能の向上につながるわけではありません。実際、企業がどれだけの地盤を補わなければならないかに気付くにつれて、後退することがよくあります。CompTIAの最新のデータによると、データの管理と分析に関して、まさに必要な場所にいると感じている企業はわずか4分の1です。デジタルトランスフォーメーションのペースを考えると、ベストプラクティスが確立される前に、この数字はさらに低下する可能性があります。

research_closing-the-data-skills-gap_3.png

リアルタイムデータと大規模なデータセットから最大の価値を引き出すために、組織はデータスキルに焦点を当てる必要があります。データを使用して社内業務を改善し、顧客をより深く理解する企業が増えるにつれて、新しいスキルや改善されたスキルがデータの成功を促進します。これらのスキルは、回復力のあるデータアーキテクチャの構築から、データ分析の速度の向上、新しい洞察のためのデータのマイニングまで、幅広いビジネス上の問題に対処します。本質的に、ビジネスの新しい通貨では、利害関係者のために価値を引き出すために新しい専門家が必要です。

データが本当に重要なリソースである場合は、適切に処理する必要があります。データ機能に対する満足度が比較的低い場合は、改善の余地が十分にあります。データ機能をしっかりと理解することで、企業戦略を構築するためのコンテキストが得られ、主要なデータ職務に対する認識がスキル構築のプロセスを導きます。

データ機能に焦点を当てる: なぜ企業はデータを必要とするのか?

CompTIAの機能的なITフレームワークは、エンタープライズテクノロジーの4つの柱、つまり、企業がIT部門内の1つの大きなバケツに技術的なすべてを投入するのではなく、組織全体でスタンドアロンの機能として管理している領域を説明しています。最も基本的な柱はインフラストラクチャ、つまりシステムをホストし、従業員を接続する物理 (および仮想) ハードウェア コンポーネントです。この基盤の上に、ソフトウェア開発は機能を提供するアプリケーションを構築します。これら 2 つの分野には、何十年にもわたって異なるスキル要件と運用プロセスがありました。

最近では、企業がデジタル資産の保護とリスク管理に重点を置くようになったため、サイバーセキュリティは専門分野になりました。歴史的に、サイバーセキュリティはインフラストラクチャ機能内で処理されてきたため、サイバーセキュリティが独立した機能に発展しても、これら 2 つの領域の間には自然なつながりがあります。

データはこれら 4 つの柱の中で最も若いものですが、急速に成長しています。業界関係者は、初代最高データ責任者(CDO)が任命されたのは2002年であり、NewVantage Partnersの2018年の調査によると、CDOを雇用する企業の数は、2012年にわずか12%で推移していたが、62.5%に達したことが示された。データサイエンスはテクノロジーで最もホットなトピックの1つですが、ビッグデータブームの中で生まれた最近の創造物でもあります。以前は、企業がネットワークエンジニアやサーバー管理者を雇用するのと同じように、同等の「データエンジニア」の役割はありませんでした。

research_closing-the-data-skills-gap_4.png

多くの企業では、データ機能はソフトウェア開発の派生として始まります。開発に必要なスキルと批判的思考は、ビットとバイトを処理するという抽象的な要素があるデータにうまく変換されます。さらに、多くのデータスペシャリストは、Python や Javascript などのプログラミング言語を含む、ソフトウェア開発者と同じツールを使用しています。昨今、企業が管理できるデータ量やデータの種類が加速したことで、特定の専門スキルに注目が集まっていますが、より高度なアプリケーションに移行する前に構築しなければならない基盤があります。

research_closing-the-data-skills-gap_5.png

その基盤は、組織全体のすべてのデータの理解、一般的なデータベースの習熟度、そして最も重要な企業データの分析など、データの基本的な管理です。データアクティビティ全体を3つの基本的な段階に分けることで、組織は適切な質問をすることができます。データはどこから来るのか?さまざまなデータストリームをどのくらいの速さで処理したいですか?データを分析する際に、どのような洞察を提供する必要がありますか?これらの質問を掘り下げることで、企業は最新のデータ管理と分析に伴う技術的な課題を理解することができます。

多くの組織、特に中小企業の分野では、強力なデータベース スキルを持たず、代わりに分析のために Excel スプレッドシートやその他の単純なツールに依存しています。企業がデータの高度化を進めるにつれて、データの流れを効率的に管理し、分析を実行するためのツールとスキルの両方が向上しています。本格的なデータアクティビティの出発点には、リレーショナルデータベースとSQL(構造化クエリ言語)という2つの確立されたツールが含まれます。

リレーショナルデータベースは、データを有用な形式で保存するための従来のメカニズムです。データ・レコードは、各レコードの特定の部分間の関係が定義された状態でデータベースに配置されます。これらの関係を理解するには、データベース内でデータを一貫して構造化する必要があります。これにより、保存できるデータの種類と実行できる分析が制限されます。リレーショナル データベース内のデータを操作するための最も一般的なツールは SQL です。SQL には長い歴史があり、一元管理されたデータベース スキーマとインデックス付きデータを運用できることで開発者の間でよく知られていますが、限界もあります。

データ量が増えると、モノリシックリレーショナルデータベースで動作するSQLアプリケーションのアーキテクチャは維持できなくなります。さらに、収集されるデータのタイプは、標準のリレーショナルスキーマに適合しなくなりました。これらの問題に対処するために、NewSQL と NoSQL という 2 つのクラスのデータ管理ソリューションが登場しました。

NewSQL を使用すると、開発者は組み込みの SQL インターフェイスを備えた専門知識を活用できますが、スケーラビリティとパフォーマンスの問題に直接対処します。SQL システムは、垂直スケーリング (1 台のマシンにコンピューティング リソースを追加する) によって高速化できますが、NewSQL システムは、データベース自体のパフォーマンスを向上させるか、水平スケーリング (新しいマシンを追加してリソースのプールを形成し、コンテンツの分散を可能にする) を利用するように構築されます。NewSQL ソリューションを使用すると、SQL 言語への接続を維持するだけでなく、企業は ACID 準拠のトランザクションを処理できるため、データベースの有効性が保証されます。

非構造化データを処理するために、多くの企業が従来のSQL製品とはさらに異なるNoSQLソリューションに目を向けています。NewSQL と同様に、NoSQL アプリケーションには、ドキュメント指向のデータベース、キー値ストア、グラフ データベース、表形式ストアなど、さまざまな種類があります。多くのNoSQLアプリケーションの基盤はHadoopです。Hadoopは、ハードウェアリソースとエンドユーザーアプリケーションを橋渡しする下位レベルのコンポーネントであるビッグデータのプラットフォームとして機能するオープンソースフレームワークです。

データツールセットが成長しているのと同じように、組織全体でデータスキルの需要も高まっています。ソフトウェア開発と同様に、データ機能はビジネスユニット内に前哨基地を持つ場合があります。部門が異なれば、データに対するニーズも異なり、自社の従業員を使用して情報を選別し、行動方針を決定する場合があります。このようなデータ人材の分散は、データサイロを生み出し、全体的なテクノロジーガイドラインを維持しながら柔軟性を実現する最適な方法を決定するため、他の組織の課題につながる可能性があります。

データチームの形成:職務と必要なスキル

すべてのデータスキルがIT部門内に一元的に配置されている場合でも、複数のビジネスユニットに分散している場合でも、企業はデータチームの確立に向けて一歩を踏み出しています。データチームの概念は比較的新しいものです。CISOのポジションが1990年代半ばに創設され、CDOのポジションが2000年代初頭に創設されたことを考えると、データチームがセキュリティチームに遅れをとっているのは当然です。データ管理やデータ分析を専門とする社内従業員がいると答えた企業はわずか44%です。すでに専任の従業員を擁している企業では、新しいビジネス価値を生み出す分析に関するスキルの開発に対する需要が依然として高いです。

データチームを構築するとき、明白な問題は、どのプレーヤーを追加する必要があるかということです。CompTIAは、Burning Glass Labor Insightsのデータを使用して、現在存在する17の異なるテクノロジーの役割を定義しました。この定義は、量とスキルセットに基づいています。各企業には業界、垂直、または既存の専門知識に基づいて個別のニーズがあるため、企業ごとに使用されるタイトルには無限のばらつきがあります。ただし、求人情報全体で使用される主要なスキルセットを調査すると、現在の求人の大部分を占めるより小さな職務を中心に統合されます。17 の役割は、独自の職務を説明するだけでなく、範囲と複雑さも伝えます。

research_closing-the-data-skills-gap_4.png

データ機能には、組織のデータチームの充実に役立つ 4 つの異なる役割があります。

  • データベース管理者: 最も伝統的なデータの役割である多くのデータベース管理者 (DBA) は、ソフトウェア開発部門内でスタートしました (そして、多くの DBA が今でもその部門に所属している可能性があります)。この役割は、SQL とスクリプトを使用してリレーショナル データベースに存在するデータを操作することに重点を置いていますが、DBA はデータ構造をホストしているシステムを理解する必要があるため、多くの場合、この役割にはインフラストラクチャ コンポーネントもあります。一般的なスキル クラスターには、データベース管理、SQL データベース、プログラミングおよびシステム管理が含まれます。
  • データアナリスト: DBAは最も確立されているため、現在最も一般的な役割かもしれませんが、データアナリストは需要の点で群をリードしています。ほとんどの企業は、標準的なデータベース操作から得られる基本的な洞察を超える準備ができており、データとビジネスオペレーションの間のつながりを探しています。「データアナリスト」と「ビジネスアナリスト」の境界線はあいまいですが、結局のところ、企業はIT部門とビジネスユニットの両方でコアスキルを構築しようとしています。一般的なスキルクラスターには、データ分析、ビジネスプロセスと分析、データ視覚化などがあります。
  • データサイエンティスト: データ分野が 4 つのテクノロジーの柱の中で最も初期段階であるように、データ サイエンティストは 17 の主要な職務の中で最も新しい参入者です。データアナリストとデータサイエンティストの主な違いは、統計モデリングを使用して将来に向けた予測的洞察を促進することです。最近、機械学習アルゴリズムはデータモデルの構築において重要な役割を果たし始めています。この役割は、最も急速に成長している役割の1つとしてよく挙げられますが、それは主に、現在の真のデータサイエンティストの基盤が非常に小さいためです。一般的なスキル クラスターには、統計、ビッグ データ、機械学習が含まれます。
  • データアーキテクト: 4つの柱すべてにおいて、アーキテクトの役割の主な特徴は非常に似ています。これらの個人は、専門的な役割のいずれかから来ている可能性がありますが、少なくとも各データ分野の実用的な知識と、他のテクノロジー機能にある程度の精通を持っています。アーキテクトの役割は適切なシステムを計画および構築することであるため、ビジネスのトレードオフとリーダーシップに精通しています。一般的なスキル クラスターには、プロジェクト管理、システム設計の実装、コミュニケーションが含まれます。

企業が改善を求めているデータ機能の領域を考えるとき、企業は分析能力を向上させたいと考えているという明確な優先事項があります。望ましい改善のいくつかは、データ管理またはデータベース管理 (検索機能またはリモート データ アクセス) のカテゴリに分類されますが、ウィッシュ リストの大部分は、より優れた分析を中心に展開しています。分析の高速化、特定のビジネス活動への分析の適用、顧客行動のパターンの発見はすべて、データアナリストが業務と意思決定を改善するために解決できる問題の例です。

research_closing-the-data-skills-gap_7.png

一般的に言えば、データマイニングは、データ管理とデータ分析の2つの世界をつなぐ活動です。データベース管理者は環境を構築する主な責任を負っていますが、特にすべての異種データセットがまとまりのあるデータレイクにまだ組み立てられていないビジネスでは、アナリストもこれらの概念を理解する必要があります。アナリストが構造を理解したら、データを掘り下げてつながりやパターンを見つけることができます。

データの視覚化は特に興味深いタスクです。技術的な知識とビジネスに精通し、コミュニケーションスキルを組み合わせています。同様に、データガバナンスには、デジタルデータに関する規制と、州や国境を越えた規制の違いの拡大に関する専門知識が必要です。急速に変化するデジタル経済において、データ分析に必要な独自のスキルをすべて見つけることは、途方もない課題になりつつあります。

データスペシャリストを見つける: データスキルが不足しているのか?

データ機能の比較的新しいことを考えると、企業はエントリーレベルのポジションに対する強い需要を持っていることが予想されます。これは正確には当てはまりません。実際、2021年に採用を計画している企業は、他のどの分野よりも多くの中堅レベルのデータスペシャリストを探しています。その説明の一部は、データとサイバーセキュリティの新興分野のチームが、既存のソフトウェアおよびインフラストラクチャチームから作成されることが多いことです。しかし、専門的なスキルに対する高い需要は、パイプラインの問題が簡単な解決策がないことを示しています。

research_closing-the-data-skills-gap_8.png

明確に定義されたエントリーレベルの役割がなければ、企業は、4年制の学位プログラムのような従来のパイプラインから資格のある候補者を獲得し、その候補者により高度なスキルを構築するための職務経験とトレーニングの機会を与えることができる、スキル開発の歴史的な手段に依存する能力が低くなります。高度なスキルに対する需要の爆発的な増加は、問題を悪化させています。

組織は、従来の4年制の学位プログラムを受講していない候補者を検討する意欲を示しています。興味深いことに、4年制の学位を持たないデータ候補者を考慮する意欲は、ITサポート以外のどの分野よりも高く、初級職としてのITサポートは、すでにブートキャンプなど、さまざまな経路を持つ分野です。

research_closing-the-data-skills-gap_9.png

企業が従来のパイプラインの考え方を超えるにつれて、労働力開発の取り組みは、短期的な候補者の発掘と長期的な企業の成功の両方に対処する必要があります。特に、データ分野などの急速に進化するテクノロジー環境では、求職者、人事担当者、採用マネージャーなど、さまざまな参加者が関与するスキル開発プロセスには、いくつかの重要な考慮事項があります。

まず、すべてのプロセスには、共通の一連の技術分野に関する専門知識の証明を含める必要があります。企業が自社の要件をより深く理解するようになるにつれて、4 年制の学位や IT 認定資格などの専門知識の標準的な指標を持つことが望ましいでしょう。これらの資格は基礎知識を確立することが多いため、候補者は独自のテクノロジーまたはベンダー固有のテクノロジーに関するトレーニングが必要になる場合があります。しかし、長期的には、強力な基盤を持つ候補者を簡単に見つけられることで、生産的な従業員を育てるために必要な全体的な時間を短縮できます。

第二に、開発プロセスは、これまでの幅広い経験に適用する必要があります。データ分析などの分野では、理想的な候補者は、データ構造や分析手法などの技術スキルや、運用慣行や財務測定などのビジネススキルなど、さまざまなスキルを持っている可能性があります。トレーニングまたは認定は、前提条件の情報の一部を持っているかもしれないが、特定のドメインの専門知識が欠けている候補者のギャップを埋めることができます。

最後に、開発プロセスは長期的な成功に向けて調整する必要があります。理想的には、企業は職務により高いレベルの快適さを持ち、キャリアをより迅速に進める候補者を見つけるでしょう。デジタル組織のペースの速い環境において、これらの従業員は自分の役割を受け入れ、成長の機会を見つけることでビジネスを前進させるのに役立ちます。

データ分野では、時間が非常に重要です。企業は膨大な量のデータを持っていますが、問題はそれをどうするかです。データを迅速かつ効果的に分析する機能により、市場投入までの時間が短縮され、顧客満足度が向上し、将来の成長を促進できます。データを離散関数として扱い、データスペシャリストを構築することで、このプロセスが加速します。組織はデータ分析のスピードアップを優先するので、スキルの発見と開発も優先する必要があります。

これは抜粋であり、レポート全文には詳細が含まれていることに注意してください。

レポート全文をダウンロード

データおよびテクノロジー業界のセクターの詳細 をご覧ください。