非公開のユーザー 2022年07月30日 カード105 いいね43
AIによる要約・使い方の説明

AIによる分析のため、間違った解釈や説明をしている場合があります。

要約

本単語帳は「はじめてのデータサイエンス」と題され、データサイエンスの定義から現代社会における重要性、背景となる技術動向までを網羅した基礎学習用教材です。

内容は、データサイエンスを「データから価値を引き出す学問」と定義することから始まり、データサイエンティストに求められる3つの資質(数学・統計、コンピューティング、実世界への応用)について触れています。また、コンピュータの5大要素やIoT、ビッグデータといったITの基礎知識に加え、スマートフォンの普及によるデータ量の増大、技術の一般化(コモディティ化)といった時代背景を学習できる構成になっています。

さらに、単なる技術論に留まらず、日本の国際競争力の現状や、市場の「ロングテール化」、価値観の変容を示す「モノからコト」といった経済・社会的なトピックも含まれています。データサイエンスがなぜ今のビジネスや社会において不可欠なリテラシーとなっているのか、その全体像を短時間で把握するのに適した内容となっています。

使い方

この単語帳は、データサイエンスの学習を始めたばかりの初学者や、ITリテラシーを身につけたいビジネスパーソンに最適です。特に、統計学やプログラミングの具体的な手法に入る前段階として、全体像(WhyとContext)を理解するための導入教材として活用することをお勧めします。

効果的な使い方としては、まず「ビッグデータ」や「IoT」といった基本用語を暗記し、その後に「なぜそれらが現代で重要視されているのか」という文脈(スマートフォンの普及や一般化など)を意識してカードを回すと、知識が定着しやすくなります。問題形式が穴埋め式になっているため、単語を答えるだけでなく、前後の文章の意味をしっかり読み解くことがポイントです。

対象者としては、G検定(ジェネラリスト検定)の初期学習者や、大学のデータサイエンス基礎科目の予習・復習を行いたい学生にマッチします。10枚とコンパクトな構成であるため、スキマ時間の5分程度を利用して、用語と社会背景の紐付けを確認するクイックチェック用として利用するのが良いでしょう。

#データサイエンス #ITリテラシー #ビッグデータ #IoT #ビジネス教養 #ロングテール #コモディティ化 #デジタル・トランスフォーメーション

広告 この位置への広告掲載を募集しています

単語カード

  • 「データサイエンスとは、社会に溢れているデータから(  )を引き出す学問である」」

    価値

  • データサイエンティストには、「数学・統計」「コンピューティング」に加えて、「(  )」を行う能力が必要である

    実世界への応用

  • コンピュータの能力が向上し、誰でもデータ活用が容易にできるようになったことを何というか?

    一般化(コモディティ化)

  • コンピュータの5つの要素とは、「入力」「演算」「出力」「制御」ともうひとつは何か?

    記憶

  • 近年大量のデジタルデータが出現し始めている。これらの「事業に役立つ知見を導出するためのデータ」のことを何というか?

    ビッグデータ

  • IoTとは「(  )のインターネット」のことを意味する。

    モノ

  • データサイエンスが近年重要視されているのは、大きく二つ理由がある。デジタル技術の急激な発展の結果、誰にでも容易にデータを活用することができるようになってきたこと。もうひとつは、インターネットとともに(  )が普及した結果、デジタルデータの発生量が増大していることである。

    スマートフォン

  • IMD世界競争力ランキングを見る限り、日本の国際競争力は近年どのように変化しているか?

    下降している

  • メガヒットが生まれにくく、個々人の好みが分散し始めている現象を「(   )」という。

    ロングテール化

  • 物質的な価値よりも体験や経験の価値の方が重要になってきていることを「(   )」と表現することがある。

    モノからコト

  • デジタル技術の活用を通じて、企業が自社の業務、組織、文化等を変革することを「(   )」と呼ぶ。

    デジタルトランスフォーメーション

  • 「あらゆる産業に影響を与える技術」のことを何と呼ぶか?

    汎用技術

  • インダストリー4.0は、ドイツが産官学を含め総力をあげて取り組んでいるプロジェクトである。これは企業や業態の枠組みを超えてネットワークで結び、ドイツ国内を「(   )」に見立てるという構想である。

    1つの大きな工場

  • 内閣府の総合科学技術・イノベーション会議が提唱した未来社会ビジョンを何と呼ぶか?

    Society 5.0

  • 国勢調査は、(   )に基づいて日本に住むすべての人・世帯を対象として実施される統計調査である。

    統計法

  • モバイル空間統計とは、ドコモの携帯電話ネットワークのしくみを使用して作成される(   )の統計情報のことをいう。

    人口

  • 現代の自動車は、コンピュータで制御するようになっているため、故障した時に何が悪いのか診断するのが難しくなった。この問題などを解決するために開発されたのは何か?

    OBD

  • 過去に他の目的のために収集されたデータを何というか?

    2次データ

  • 広告
  • データは、内部に定義された構造を持つかどうかによって、「非構造化データ」「準構造化データ」「構造化データ」に分類される。では、一般的な情報システムで扱う、財務データや顧客データは、このうちのどれにあたるか?

    構造化データ

  • Excel等の表計算ソフトで使われている、「カンマ区切りで並べた値」という意味を持つデータ形式のことを何というか?

    CSV

  • 特定のデータが、一切の著作権、特許などの制御メカニズムの制限なしで、全ての人が望むように利用・再掲載できるような形で入手できるべきであるという考え方を何というか?

    オープンデータ

  • 人間の知的能力をコンピュータ上で実現する様々な技術、ソフトウェア、コンピュータシステムのことを何というか?

    人工知能

  • AIは、これまでに3回のブームが来たと言われている。このうち現在も続く第3次ブームは何の時代と呼ばれているか?

    「機械学習・ディープラーニング」の時代

  • AIの第2次ブームのときに生まれた、「専門領域の知識を取り込み、推論を行うことで、専門家のように振る舞う」システムのことを何と呼ぶか?

    エキスパートシステム

  • AIに関連する技術である、「ディープラーニング」と「機械学習」との関係は以下のどれか?

    「ディープラーニング」は「機械学習」の一部である

  • AIは既に以下のゲームにおいてそれぞれのトッププロに勝利している。このうちもっとも内容が複雑なため、AIの勝利が最も遅かったゲームはどれか?

    囲碁

  • 製造業におけるAI活用のひとつで、機械の稼働データを読み解いて、通常ではない状態に陥ったことをリアルタイムに察知し、故障やトラブルを未然に防ぐことを何というか?

    異常予測

  • 国立情報学研究所を中心に実施された「ロボットは東大に入れるかプロジェクト」は、英語と国語の得点が伸びず2016年に中止が決定された。この理由は何か?

    AIの「読解力」が足りなかったから

  • 画像や動画から特徴をつかみ、対象物を識別する技術を何というか?

    画像認識技術

  • 機械学習とは、AIのプログラム自身が(   )する仕組みのことをいう。

    学習

  • 機械学習のうちのひとつで、コンピュータが取った行動に対する結果のフィードバックを元に強化(改善)していく仕組みを何というか?

    強化学習

  • 十分なデータ量があれば、人間の力なしにコンピュータが自動的にデータから特徴(特徴量)を抽出してくれる学習方法のことを何というか?

    ディープラーニング

  • 「シマ」と「ウマ」に関する知識を学んだAIであっても、「シマウマ」を認識することが困難である。このAIの難問を何というか?

    シンボルグラウンディング問題

  • 広告
  • 哲学者のジョン・サールは、AIを「強いAI」と「弱いAI」に分類した。「強いAI」とは「人間が心を持つのと全く同じ意味で心を持つ、本当に知性のある機械」のことを指し、「弱いAI」とは「限定された知能によって一見知的な問題解決が行える、知能があるように見える機械」のことを示す。では、現状のAIはこのどちらにあたるか?

    弱いAI

  • AIが発展したとしても、AIによって代替される可能性が低い職業・仕事も存在する。野村総合研究所によれば、代替しにくい仕事の特徴には、「(   )」「ソーシャル・インテリジェンス」「非定型」の3つの要素を含んでいるという。

    創造的思考

  • 「情報の表現であって、伝達、解釈または処理に適するように形式化され、再度情報として解釈できるもの」を何というか?

    データ

  • BellingerのDIKWモデルは、4つの層から構成されている。下から、「データ」「情報」「知識」だが、最上段に位置する「知識を活用して人間が活用・判断するもの」とは何か?

    知恵

  • 野中郁次郎によるSECIモデルにおいては、知識は二種類に分類されている。社会的・客観的で言葉で表現できる知識のことを「形式知」と呼ぶが、もうひとつの「個人的・主観的で言葉で表現することが難しい知識のことを何というか?

    暗黙知

  • 仮説を構築する方法としては、まず自分が考えている初期仮説から検証を始める「仮説検証型アプローチ」と、データを見ながら気づいた特徴から仮説を組み立てる「(   )」がある。

    仮説探索型アプローチ

  • 問題の原因解明や解決策立案のための分析手法で、仮説検証型アプローチでよく活用されるものは何か?

    ロジックツリー

  • データ分析結果に基づいて、適切な施策提案を行うためには、「 (   )」「事実」「解釈」を混同せずに伝える必要がある。

    仮説

  • KJ法で有名な川喜田二郎は、科学には3つの種類があると述べている。このうち、「ありのままの自然を観察し、仮説を立てるための科学」を何というか?

    野外科学

  • コマツのKOMTRAXは、移動体通信技術により建設機械車両に関するデータを収集・活用するサービスである。KOMTRAXで収集しているデータのひとつに、「車両の現在位置」があるが、これはどのように活用されているか?

    盗難防止

  • 小売業では、POSレジを使うことによって、「いつ何が何個いくらで売れたか」が管理できるようになる。近年、ポイントカードを使うことによってさらにどのようなデータが取得できるようになったか?

    「誰が買ったか」というデータ

  • AIを用いて資産運用助言サービスを行うことを何というか?

    ロボ・アドバイザリーサービス

  • 特定地域における様々な交通手段が統合され、一つのサービスとして提供するものを何と呼ぶか?

    MaaS(Mobility as a Service)

  • 乗り物、空間、モノ、人などの(   )をインターネット上のプラットフォームを介して、賃借や売買、交換するという新しい経済の動きをシェアリングエコノミーと呼ぶ。

    遊休資産

  • メーカーが自社製品を、直接一般消費者に販売するという自社完結型のビジネスモデルのことを何と呼ぶか?

    D2C

  • 広告
  • 「都市が抱える諸問題に対して、ICT等の新技術を活用しつつ、マネジメントが行われ、全体最適化が図られる持続可能な都市」のことを何というか?

    スマートシティ

  • 需給によってモノやサービスの価格を変動させることを何というか?

    ダイナミックプライシング

  • 中国のアリババグループが提供している「芝麻信用」(ゴマ信用)は、ネットショッピングやネット融資、SNSなどの利用状況をもとに、(   )を評価するサービスである。

    個人信用

  • データから特徴を学習することで実在しないデータを生成する手法を何というか?

    敵対的生成ネットワーク

  • 強化学習は機械学習のひとつで、ある環境下で、目的とする(   )を最大化するためにどのような行動をとっていけばいいかを学習していく仕組みをいう。

    報酬(スコア)

  • AIにおいて、ある領域で学習したこと(学習済みモデル)を別の領域に役立たせ、効率的に学習させる方法のことを何というか?

    転移学習

  • 銀行等からではなく、一般の人々から資金を少しずつ調達できるサービスを何というか?

    クラウド・ファンディング

  • 足りない人的リソースをインターネット経由で集めるサービスを何というか?

    クラウド・ソーシング

  • 直接、数値ではかることができる変数のことを「量的変数」というのに対して、数値ではかることができない変数のことを何というか?

    質的変数

  • ものごとを評価したり判断したりするときの基準・ものさしのことを何というか?

    尺度

  • 「さいころの出目」や「デジタルデータ」のように、とびとびの値を取る変数を何というか?

    離散変数

  • (   )は、データの散らばり具合を示す指標である。

    分散

  • 平均を50、標準偏差が10になるように、各データを変換し、データ内における位置を表した値を何というか?

    偏差値

  • アンケート等で、入力ミス等によりデータの一部に無回答部分ができることを何というか?

    欠損

  • 欠損・外れ値・異常値を含むデータに対して分析前に行うことを何というか?

    データクレンジング

  • 二つの事柄に何らかの関係性があるもの、もしくは一方が増加するとき、他方が増加または減少する傾向が認められている二つの量の関係を何というか?

    相関関係

  • 原因とそれによって生じる結果との関係、もしくは一方が原因として他方を変動させることを何というか?

    因果関係

  • データを分析したところ、「アイスクリームの販売量」が多いほど「水難事故の発生件数」は多いように見える。このときの両者の関係を何というか?

    疑似相関

  • 「アンスコムの例」とは、平均値、分散、相関係数といった統計量や回帰直線が類似しているが、データ群が(   )をいう。(   )の中に入る言葉は何か?

    全く異なるもの

  • 広告
  • 目的のために本来知りたい集合全体を「母集団」という。それでは、母集団の情報を推測するために選ばれた一部の集団のことを何というか?

    標本

  • 物事を判断したり決定したりするときに、人間が様々な外的あるいは内的要因により、偏った考えを持ち、非合理な判断を下してしまうことを何というか?

    認知バイアス

  • 与える情報を制限したり、改変したりすることによって、その情報を受け取ったものが受ける印象や判断結果に影響を与えようとする行為を何というか?

    印象操作

  • どのデータ項目が大きいか小さいかを図形の長短で表すグラフは何か?

    棒グラフ

  • 全体の中で各データ項目がどのくらいの割合を占めているかを表すグラフは何か?

    円グラフ

  • 時間経過に沿った数量の変化や傾向を示すグラフは何か?

    折れ線グラフ

  • いくつかの変量をまとめて比較するもので、全体の傾向を掴むときに活用する、別名スパイダーチャートとも呼ばれるグラフは何か?

    レーダーチャート

  • 例えばインターネットマーケティング等において、施策の良否を判断するために、異なる二つの施策同士を比較検討することを何というか?

    A/Bテスト

  • グラフを構成する要素の中で本来の目的から見て不要あるいは過剰な装飾等の視覚的要素のことを何というか?これはできるだけ使わないようにすべきである。

    チャートジャンク

  • ジョン・スノウは、コレラを発症した患者の家を地図上にプロットして(   )を作成し、コレラマップと呼ばれるものにまとめた。スノウは、これによって、コレラの原因が最近に汚染された水にあることを発見した。(   )の中に入る言葉は何か?

    棒グラフ

  • データ分析のアプローチを以下に示す。(   )に入る言葉で最も適しているものは何か? 目的の明確化→計画の立案→(   )→結果の解釈と施策立案→実施と検証

    分析の実施

  • 相関関係が高いデータ(一方のデータの値が大きくなると、もう一方のデータの値も大きくなる(正の相関))においては、相関係数はどのようになるか?

    相関係数が1に近づく

  • 「RFM分析」とは顧客を層別に可視化し分析する手法である。RFM分析における「R(Recency)」はどのような値を意味するか?

    最終購入日から顧客毎の経過日数

  • 「RFM分析」における「F(Frequency)」はどのような値を意味するか?

    顧客毎の来店回数

  • 「RFM分析」における「M(Monetary)」はどのような値を意味するか?

    顧客毎の購入金額

  • 顧客満足度が向上することによって顧客はどのようになるか?

    顧客はリピーターになる

  • 広告
  • 今回の演習で活用したテキストマイニングとは、何から有益な情報を取り出すことを総称するか?

    テキストデータ

  • 「ELSI」とは何か?

    倫理的・法的・社会的な課題

  • 「データの捏造」とは何か?

    存在しないデータを作成すること

  • 「私生活上の事柄をみだりに公開されない法的な補償と権利」もしくは「自己に関する情報をコントロールする権利」のことをなんというか?

    プライバシー

  • 個人情報保護法上の「個人情報」とは、「(  )に関する情報で、特定の個人であるとわかるもの及び、他の情報と紐づけることにより容易に特定の個人であるとわかるもの」のことを言う。

    生きている個人

  • 「ユーザーから、情報発信や第三者への個人情報提供の事前承諾を得るプロセス」のことをなんというか?

    オプトイン

  • 2000年代以降、欧州を中心に個人情報保護の一つとして議論されるようになった「自分の情報を消すことを企業に求めることができる権利」を何というか?

    忘れられる権利

  • 日本で検討されているもので、「個人から本人に関するデータを預かり、預かったデータを個人に代わって蓄積・管理・活用し、その結果得られた便益を個人に還元する事業者」のことをなんと言うか

    情報銀行

  • バイアスとは偏向、偏った見方のことを言う。バイアスがあるとどのような問題が発生するか?

    真実の姿からの認識のずれが生じてしまう

  • シーズナル・バイアスとはどのようなものか?

    どの季節に調査するかによって結果が異なる

  • トランスレーション・バイアスとはどのようなものか?

    質問を完全に同じ意味を持つ言葉に翻訳できないことから生ずるもの

  • アルゴリズムバイアスとは、バイアスのかかったデータを活用したため、出来上がったアルゴリズムに生じるバイアスのことを言う。では、アルゴリズムバイアスを生じるとどのようなことが起きる可能性があるか?

    不平等なAIが作られる

  • 世界中で現在「AI活用のための原則」が整備されつつある。これはなぜ必要なのか?

    開発者も利用者も注意深くAIを取り扱い、信頼性を高め、正しい使い方をしているかを検証していく必要があるから。

  • 2019年に内閣府で決定された「人間中心のAI社会原則」では、どのようなビジョンが掲げられているのか?

    AI-Readyな社会

  • 「人間中心のAI社会原則」における7つの原則のうち、「人間中心の原則」とはどのようなことを意味するのか?

    憲法や基本的人権を侵すものであってならない

  • 情報セキュリティとは「(  )を安全に守る」ことを言う

    情報資産

  • 情報セキュリティの目的は「情報システムに依存するものを可用性・(  )・完全性の欠如に起因する危害から保護することである」

    機密性

  • 広告
  • 「人が不正を働くのは「(  )」「機会」「正当化」の3つの条件が揃ったときであるという理論を「不正のトライアングル」という。」

    動機

  • コンピュータウイルスは、プログラムやデータベースに対して意図的になんらかの被害を及ぼすように作られたプログラムで、「自己伝染機能」「(  )」「発症機能」の3つの機能のうち1つ以上を有しているものをいう。

    潜伏機能

  • サイバー攻撃に対応するためには、水際で防ぐだけでなく、「入口対策」「(  )」「外部対策(出口対策)」といった総合的な対策の実施が必要不可欠である。

    内部対策

  • 暗号化とは需要な情報を第三者が見読できない状態にすることをいう。暗号には「共通鍵暗号方式」と「(  )」がある。

    公開鍵暗号方式

  • 認証技術とは、対象の正当性、真正性を検証する技術のことを言う。認証には「知識による方法」「(  )」「生体情報による方法」の3つがある。

    所有による方法

コメント