Share on facebook
Share on linkedin
Share on twitter
Share on facebook
Share on linkedin
Share on twitter

今注目のデータサイエンティストに求められる条件

ここ数年、企業が保有するデータ量が爆発的に増加しており、データ管理負担の増大やセキュリティへの対応など、ビジネスに様々な影響を与えている。一方、データを収集、分析し、人工知能(AI)テクノロジーの原動力として利用できる企業にとっては、宝の山といえるだろう。

これからもデータは増加し続け、データ分析技術は進化を続ける。データ利用のニーズが高まれば、データサイエンスやデータサイエンティストの需要はさらに増える。私は2013年からデータサイエンス分野で働いているが、Appierにおいてデータサイエンスチームのみんなと日々新しい謎解きに取り組むことが楽しくて仕方ない。

データサイエンティストの実務

データサイエンスを手短に説明すると、データを使用して現実社会における実務問題を解決方法を提示することである。例えばECビジネスのユーザーのデモグラフィックやアプリの使用パターンを基にレコメンデーションをプッシュ通知する、または特定商品の売上減の理由を分析することなどが、AIを活用した業務に含まれる。

データサイエンティストは、問題解決に取り組む際、まずデータの抽出と連結に着手し、そこからパターンやトレンドを分析していく。その後、それを基に予測モデルの構築、インサイトの抽出、PoC(概念実証)による問題解決の方法を検証する。通常、私たちが手掛ける問題は極めて特殊であり、汎用性のある標準的ソリューションといったものはない。そのため、既成概念の枠を超えてさまざまな可能性のあるソリューションを見いだすことが、データサイエンティストに課せられた使命である。

ソリューションの成果は実際にそれを導入してみるまで分からないため、それが期待どおりの成果をもたらさなかった場合、振り出しに戻り最初からやり直さなければならない。しかし、だからこそ、つかみどころのない問題を突き止め、解決策を考え、成果を収めるプロセスにやりがいと達成感があるといえる。

優れたデータサイエンティストの資質

当然のことながら、どんな仕事にも好きな業務とそうでないものがある。データサイエンティストが楽しめない作業の一つはデータクレンジングである。多くの場合、データサイエンティストはエラーや矛盾を含んだ「ゴミだらけのデータ」を収集する。例えば、データが商品の売上激減を示したとしても、機器の誤動作によって正確なデータが収集されなかっただけかもしれない。 データサイエンスは8割がデータクレンジングで、残りの2割はそれについて文句を言うことだという内輪の冗談さえある。それはさておき、データクレンジングは、手間はかかるが重要な作業である。これが適切に行われなければ、インサイトの正確さと信頼性に重大な影響を与える。

どんなに高度な技術を身に付けていたとしても、優れたデータサイエンティストはこうした細部へのこだわりと注意のほかに、事業領域と事業目標に精通していなければならない。データサイエンティストが提供するソリューションは創造的であるとともに、有用かつ実用的なものでなければならない。

最新の研究や調査、分野の動向

優れたデータサイエンティストであり続けるために、機械学習に関する最新の研究や調査を掌握すること、最新トレンドを理解し、特定の問題の解決方法を検索することは重要なタスクといえる。すでに解決されている問題は、わざわざ最初から取り組む必要はない。そのため、日頃から機械学習の進歩や興味分野の研究論文に目を通すようにしている。それと同様に、同僚との議論や、彼らの研究成果の追跡、機械学習のトレンドに関する意見交換も重要である。これは機械学習の最新動向の把握に役立つ。

AIエキスパートの需要増加

残念ながら、データサイエンティストに対する需要の高まりと、機械学習分野での人材供給にはギャップがある。AI分野の職業は最近新しく生まれたキャリアパスであり、必要な専門知識を備えた人材が不足している。また、データサイエンティストの誰しもがビジネスに精通しているわけではないという事実も、このギャップを広げる原因になっている。データサイエンティストの中には学術研究環境で問題解決を図ることには優れていても、ビジネスに関する現実問題の解決には対応できない場合がある。

今日のデータサイエンティストは、常にスキルを磨いていく必要があると実感する。企業や組織にAIやディープラーニングの導入が進むことによって、下位レベルのタスクは自動化され、データサイエンティストたちはより難解な問題に取り組むことになる。多くのビジネスケースに適用できる簡易モデル構築用のツールは成熟化が進み、使い勝手もますます良くなっていくだろう。

近い将来のデータサイエンティストには、問題解決のために特定の情報を活用する方法をもとめられるようになるだろう。AIテクノロジーの複雑化にともない、データサイエンティストは、単純な処理作業や分析作業を自動化ソフトウェアに託し、より抽象的な問題に取り組むことになると予想している。

WE CAN HELP

Letus know how we can help improve your marketing strategy

YOU MIGHT ALSO LIKE

新型コロナ禍でも安全な広告戦略を可能にする自然言語処理技術

世界的な新型コロナウイルス感染は、プログラマティック広告業界に大きな影響を与えています。ブランドセーフティへの懸念から、この感染症に関連するキーワードがブラックリスト化されています。これにより広告出稿するが激減し、パブリッシャーは収益が低下するどころか損失が生じています。 この憂慮すべき傾向に対応して、パブリッシャーやメディアの専門家は、企業に新型コロナウイルスに関連したキーワードのブロックを止めるよう促していますが、これは健全な取り組みといえるでしょうか? 企業は広告において自社ブランドを正しい形で掲載するために現状の広告を再考する必要があるでしょう。こうした状況の中、広告の配置に自然言語処理技術を導入することでより安全に広告戦略を立てることができます。 新型コロナウイルスの影響で、世界中の多くの人々が家にいることを要請あるいは命令されている今、オンラインメディアなどのコンテンツ消費が大幅に増加しています。GlobalWeb Indexによる世界的な調査によると、現在、消費者の95%が家の中でオンラインメディアの消費に時間を費やしています。当然のことながら、最も消費が急増しているのはニュース報道であり、3人に2人が情報を得るためにニュースサイトを利用する時間が増えています。   オーディエンスの拡大の一方でインプレッションは縮小 NewsWhipによると、1月以降、ウェブやオンラインメディアにおいて150万本以上の新型コロナウイルス関連の記事が掲載されました。パブリッシャーにとっては、毎日のように新型コロナウイルス関連の新しい報道に伴い、大量の記事を掲載することになります。これらの記事をより多くの消費者が閲覧すると想定すれば、広告のインプレッションと収益は増加するはずです。 しかし、実際にはそうではありません。パブリッシャーは、これまで以上に多くのオーディエンスを獲得できるかもしれませんが、企業はより慎重になってきています。さらに、これらの新しい制限が設けられたことで、旅行やホスピタリティなどの一部の業界はビジネスに大打撃を受けていることから広告費を減少させています。 eMarketerの予測では、世界の今年のメディア広告費は約7,120億米ドルに達すると予測していましたが、現在は6,917億ドルにまで落ち込んでいます。しかし、これは2019年に比べて7%増加しており、危機にもかかわらず広告がビジネスとして成立していることを意味しており、特に新型コロナウイルスに関連のあるものを提供している企業にとっては、このことは重要な意味を持っています。   ブランドセーフティと出版危機 広告を続けている企業にとって、ブランドセーフティの問題は、通常以上に大きな関心事です。公衆衛生上の危機は、企業が一般的に関連付けられていることを望むものではありません。結局のところ、否定的な話の横に広告を出すと、ブランドの印象が悪くなる可能性があります。残念なことに、新型コロナウイルス感染の報道が増えている中、それを回避することはほぼ不可能になっています。 Marketing Interactiveの記事によると、企業は自社の広告を安全に配置するために「コロナウイルス」、「新型コロナ」、「公衆衛生危機」、「自粛・閉鎖」、「肺炎症状」や「大規模感染」を含む、新型コロナ危機に関連するすべてのキーワードをブラックリスト化しています。広告にはこれらのキーワードが含まれていないコンテンツに限定されることから、広告出稿の規模は減少しています。 しかし、実際のところ、こうしたブランドセーフティ戦術は必要ないかもしれません。Kantar社の2020年3月の調査によると、企業が広告停止を優先すべきだと考えている世界の消費者は全体のわずか8%にすぎません。その代わり、回答者の77%が広告に「新しい日常生活の中で企業や製品がどのように役立つかを語ること」を期待していると回答しました。   「新型コロナ感染」はブラックリストに載せるべきなのか? このような危機を防ぎ、パブリッシャーを支援し、顧客との関連性を保つために、広告業界の専門家は企業にブランドセーフティ戦術を再考するようアドバイスしています。議論の核心は、新型コロナウイルスの情報は今や日常生活の一部となっているため、新型コロナ関連のコンテンツの隣に広告を掲載しても、同じようなネガティブな影響を与える可能性は低いということです。GumGum, Inc.の新しい調査によると、新型コロナ関連コンテンツの62%は実際にはブランドを傷つけるものではないとのことです。 自然言語処理のようなAI技術を活用すれば、柔軟性のないキーワードブロック機能を迂回して、ブランドセーフティを確保した形でプログラマティック広告を実施することができます。   ブランドセーフティを確保するための自然言語処理の利用 自然言語処理とディープラーニング技術を搭載したソリュ―ションは、人間が普通に使っている言語を分析し、理解するためにアルゴリズムを使用します。プログラマティック広告の文脈では、文脈を理解するためのユニークなキーワードを分析するのではなく、それの背後にある意味や意味のより詳細な分析を実行することができます。 これらのアルゴリズムは、テキスト、音声、画像、メタデータ、位置情報などをリアルタイムかつ大規模に分析することができます。これにより、広告やメッセージに使われているコンテンツと特定のキーワードとの関連性が肯定的なのか否定的なのかを把握することができ、多面的に状況を理解することが可能になります。

VIEW >

人間と共存する AI(人工知能)

人工知能(AI)は、これまで人間の知能と競り合い、そして上回ろうとする技術と考えられていました。しかし、AIに対する捉え方が変わりはじめています。人間の能力以上のスピードでデータ処理が可能になったAIは、特に画像や音声データの処理や合成に優れており、人々に利益をもたらしました。 しかしながら、予期せぬことが起こった場合の対処には限界があるのが現状です。本来のAIに求められることは生産性を向上させることですが、想定外のことに対応ができないことは、この生産性を妨げる可能性があります。 AIが人間より優れた能力を発揮するのではなく、人間と協力してAIを使う人々のパフォーマンス向上に焦点を当て、目の前のタスクを解決することが重要です。人間とAIが協力すれば、人間にとっての利益は大きなものとなるはずです。それが「人間中心のAI」です。 1. 人間にしかできないこと AIに具体的な目標とその達成方法を教えると、人間よりも高いパフォーマンスをだします。ビックデータを使用して深層学習(ディープラーニング)を適用すれば、AIは人間のパフォーマンスを超越するのです。しかしながら、想定外の状況下では、AIのパフォーマンスは、人間がプレッシャーや疲労を感じていない限り、人間のパフォーマンスよりも劣ります。その一例として、2011年にIBMのWatsonコンピュータがゲームショーで対戦相手に勝った時のニュース報道があります。(英語資料) 例えば、自動運転車は、疲労や注意散漫のような人的ミスを排除することができるので、人間が運転する車より安全といえます。しかし、自動車の前に風船が飛んで来た場合など、人間は状況に驚いたとしても、安全に運転をし続けることができますが、AIは想定外の状況下では危険なリアクションをしてしまう可能性があります。他にも、AIは人間の医師よりも多くのサンプル画像を入力し、学習することができるため、腫瘍を正確に識別できる可能性があります。しかし、医師は患者との信頼関係を築き、病状の説明をする必要があります。これは現在のAIが行うことはできません。   2. 人間 対 AI   AIの導入プロセスから人間を排除するのではなく、人間中心のAIこそがAIを使ったビジネスを成長させ、人間の求めているAIビジネスを導くのです。この分野で最前線をいく、スタンフォード大学の人間中心のAI研究所は、次の3つを焦点とすべきとしています。(英語資料) 1. 人間と社会における、AIの影響を研究し予測する 2. 人間の生産活動を促進する、AIシステムを構築する 3. 新しいAI技術を開発するために、人間の知能についてより深い理解を研究する 今日のビックデータを使用した機械学習は、人間の知能と完全に一致しておらず、特に3点目が重要視されています。人間中心のアプローチは、単なるデータやアルゴリズムを超えた、実社会に役立つ利益をもたらします。 特定の分野において、人間は機械よりはるかに優れており、全ての仕事をロボットに代替するのは不可能です。人間はごく少数の事例から学ぶことが得意です。 また、新しい状況に直面したとき、大量のデータを収集する前に、適切に状況を捉えて対処することができ、その点でも人間の知能はAIよりはるかに効率的です。 人間には洗練されたセンサーが備わっていて、デジタルカメラなどのセンサーがかなり優れているとしても、ロボットが人間の嗅覚、味覚、触感を再現することはできません。例えば、マッサージ師は触っただけでどこが痛いのか判りますが、十分なタッチセンサーがない機械ではそのような直感を発展させることはできません。そのため洗練されたマッサージをすることはできないでしょう。  

VIEW >

購入をためらうオンライン消費者を購入につなげる方法

多くのオンラインビジネスは、売上が低い場合、オンライン消費者の行動を理解することに力を入れるよりも、ショッピングカートの放棄率が高い原因を分析することに焦点を当てる傾向があります。 定量化可能なデータを活用して、ユーザーインタフェースの再設計やコンテンツの見直しなど自社のEコマースサイトをある程度変更することができますが、顧客の全体像を把握するには、購入にいたるまでの全体の行動を把握する必要があります。 2019年の第2四半期において、世界のEコマースサイトへのアクセスのうち、わずか2.58%が購入へと繋がりました(英語資料)。言い換えると、サイト訪問者が34人の内、商品を購入したのはたった一人だったということになります。 視点を変えて、「閲覧から購入までの過程で何が上手くいかなかったのか」を特定することで、購入を完了しなかったユーザーをビジネスチャンスとして見ることができます。以下4つのステップに従って、購入をためらうオンライン消費者をどのように後押しをするか、実施できるプランを作成しましょう。   1. 顧客の特定行動を把握して、メールを送信する   Eコマースサイトの探索中、買い物客は通常、ニュースレターの購読、カートの放棄、特定のカテゴリの閲覧など、サイト上で様々な行動をとります。マーケターは、機械学習を活用してこれらの行動を分析し、顧客の行動と関心に応じて顧客をセグメント化します。 次に、AIを搭載した顧客エンゲージメントプラットフォームを使い、事前に定義されたターゲットセグメントを選択し、ターゲットオーディエンスにメールを送信します。 例えば、田中さんがあるファッションサイトのドレスを数着閲覧した後、このサイトが発行するニュースレターに登録したものの何も購入せずにサイトを離れたとします。田中さんに今後もサイトに来訪してもらうため、サイト上の人気ドレスやファッションのコーディネーションに関するアドバイスなどのメールを配信することができます。   2. パーソナライズされた商品レコメンデーションで購入決定の後押し   人間の行動にはつねに理由があり、消費者行動も例外ではありません。顧客がサイトを離れたり、購入を停止したりする理由は何か考える必要があります。 顧客の行動パターンと関心に関する自社データとサードパーティデータを組み合わせて、機械学習を適用することで、価格、商品の在庫切れ、購入ページの不適切なデザインなど、問題を明確にすることで行動に対する理論的根拠を分析します。 可能な原因を突き止めたら、適切なチャネルを介してパーソナライズされたコンテンツで顧客を継続的に接触できます。Wirecardのレポート「International Holiday Shopping Report 2018」によると、アジアにおける買い物客の90%がアプリ、モバイル、パソコン、実店舗すべてを利用して購入前に価格を比較をしていることが分かりました(英語資料)。そのため1つの重要な決定は、適切なチャネルと適切なメッセージの組み合わせを特定することです。 例えば、田中さんがアパレルサイトを閲覧し、カートにパーティードレスを追加した後サイトを離れたとします。データによると彼女は外部のサイトで最近、忘年会パーティーに適したドレスに関するブログを閲覧したことが分かったとします。この情報を基にパーソナライズされたレコメンデーションをプッシュ通知で送信することができます。カートに追加したドレスに関するコンテンツの他にも、そのドレスに合った靴からクラッチバックまで、全体のファッションを完了させる内容の広告メッセージを送信することが可能です。   3.

VIEW >