内閣府の定義”サイバー空間とフィジカル空間を高度に融合させたシステムにより経済発展と社会課題の解決を両立する人間中心の社会”
Society5.0
人間がアナログ形式で実行している業務をAIに置き換える際に発生するプロセス
BPR・Business Process Re-engineering
経済産業省が推奨する「AI・データ利用に関する契約ガイドライン」では(A)型のソフトウェア開発方式が推奨
探索的段階
探索的段階型プロセスの二番目に当たる(A)では発注側の求める機能や精度を満たすような学習済みモデルを生成できるか検証する
PoC/Proof of Concept・概念実装
(A)開発様式では、開発工程を「企画→設計→開発→テスト→運用」分け最初に全体の機能の設計と計画を決定し開発実装する
ウォーターフォール
(A)開発では小さい単位や機能ごとに工程を分割しイテレーション(反復)と呼ばれるサイクルを実施する
アジャイル
プロジェクトを開始する前に第三者への情報の漏洩または不正利用を防止するための契約であり機密保持契約・秘密保持契約の一種
NDA・Non-Disclosure Agreement
受注契約の一種で受注側が「指定業務の遂行」することを確約することが目的の契約。成果物に対する必要条件が設けられず成果物への修正や保証を要請できない場合がある
準委任契約
受注契約の一種で受注側が「条件を満たす成果物を納品」することを確約する契約であり仕事を完成し成果物を納品する義務が生じる
請負契約
AI開発において「AI・データの利用に関する契約ガイドライン」では(A)類型が推奨される
準委任契約
手元にインフラやソフトウェアがなくともインターネット経由でリソースを必要な時に必要な量利用する仕組み
クラウドサービス
ソフトウェアやアプリケーションの機能をインターネット経由で提供するクラウドサービス形態
SaaS・Software as a Service
アプリケーションが稼働するプラットフォームを提供するサービス
PaaS・Platform as a Service
ネットワーク、サーバー(CPU,GPU,メモリ・サービス)などのコンピューティングリソース提供するサービス
IaaS・Infrastructure as a Service
クラウドの逆概念で必要な設備の購入、システム構築運用管理を全て自社で行う
オンプレミス
AWSやGoogleなどが提供するクラウド上のリソースを使用してAIのデータ処理やモデルの学習予測を行う
クラウドAI
ソフトウェアやプログラムの一部を公開し他のコンピュータやソフトウェアと機能を共有するためのインターフェース
API・Application Programming Interface
システムの末端に位置するデバイスに直接搭載し、そのデバイスの上で実行されるAI
エッジAI
手元のコンピュータを用いてデータを処理しAIモデルを構築するエッジシステムを利用しデータの分散処理を行うこと
エッジコンピューティング
事業のあり方ビジネスモデルやサービス形態の”デジタルによる変容”を目指す概念
DX・デジタルトランスフォーメーション
製品やサービス、技術開発などで社外組織から知識や技術を取得し社内に取り込むことで自前主義からの脱却を図ること
オープンイノベーション
生成速度と更新速度が非常にはやい大規模なデータ群
ビッグデータ
家電がインターネット接続されデータを活用する技術
IoT・Internet of Things
コンピュータやソフトウェアロボットを通じ主に定型的な事務作業を自動化・効率化すること
RPA・Robotics Process Automation
AIプロジェクトにおいて機械学習の開発担当と運用担当が連携しながらモデル開発から運用までの一連を管理する体制を目指す概念
MLOps・Machine Learning Operation
Business Understanding/ビジネスの理解、Data Understanding/データの理解、Data Preparation/データの準備、Modeling/手法選択、モデル作成、Evaluation/結果の評価、プロセスの見直し、次のステップの計画、Deployment/本番環境への展開の6つのフェーズから構成される標準ステップ
CRISP-DM・CRoss-Industry Standard Process for Data Mining
分散的に管理された複数のコンピュータをネットワーク接続し暗号化されたデータコピーを全端末で共有する仕組み
ブロックチェーン・Blockchain
Blockchain は中央管理者を必要としない(A)システム
自律分散
Blockchainはネットワークの一部不具合が発生してもシステム全体がダウンすることなく運用できシステムの(A)が保たれる
可用性
ハッシュや電子署名という暗号技術によりデータの改竄を監視・検出でき(A)が満たされている
完全性
Blockchainとクラウド型データベースでは(A)の方がより可用性と完全性が高い
Blockchain
開発者やシステム管理者がコンテナという単位でアプリケーションを構築、実行、共有するためのプラットフォーム
Docker
プラットフォームDockerでは、(A)と呼ばれる技術が使用されている
コンテナ型仮想化
Pythonは(A)言語であるため高速なコンパイル言語に比べ処理速度が劣る
スクリプト
プログラミングで使用するデータ処理機能をまとめたソースコードやプログラム部品の集まり」
ライブラリ
Webページを巡回し、情報を収集すること
クローリング
収集した情報から必要なデータだけを抽出すること
スクレイピング
多次元配列データの高速演算を得意とするライブラリ
NumPy
構造化データなどの表形式データの処理に特化したライブラリ
Pandas
書式設定に対するカスタマイズ性にも優れたデータを可視化するためのライブラリ
Matplotlib
Pythonのオープンソースライブラリで機械学習モデルの実装一連をサポートする
scikit-learn
コーディングインターフェイスの一種でありブラウザで動作するプログラムの対話型実行環境であり、セル単位でコードを書いてセル単位での実行が可能
Jupyter Notebook
Jupyter Notebookは(A)やgoogle Collaboratoryなどの専用環境で記述可能
Anaconda
Pythonはスクリプト言語であるがそのライブラリの多くがC言語やFortranなどの高速な(A)言語で書かれている
コンパイル
明確に「列」と「行」の構造を持っている表型データ
構造化データ
構造が統一的な「列」と「行」で整理されていないデータであり画像データや音声データが該当する
非構造化データ
国、自治体、研究機関、独立行政法人、企業などが公開している無償で利用可能なデータセット
オープンデータ
オープンデータは(A)に適したデータ形式で、二次利用可能な利用ルールで公開されたデータ
機械判読
特定のクラス(範囲内)のデータ数が、他のクラス(範囲内)のデータ数よりも有意に多い状態のこと
バイアス
データそのものが偏っていること
データバイアス
母集団から標本抽出を行う段階で生じる統計的偏りで、統計学では「系統誤差」とも呼ばれる
サンプリングバイアス
データバイアスへの事前対策としてサンプリングバイアスを防止しながらサンプルデータを集めるのに利用される、母集団をあらかじめ複数の層に分けて各層の中から必要な数だけ無作為抽出する手法
層別抽出法/層化サンプリング・Stratified Sampling
データサンプリングへの事後対策として偏りを補正する手段として行われるデータ数の少ないクラスを水増しする方法
アップサンプリング
データサンプリングへの事後対策として偏りを補正する手段として行われるデータ数の多いクラスを間引くこと
ダウンサンプリング
教師あり学習のためのデータに正解ラベルを付与するプロセス
アノテーション
モデルに用いられるアルゴリズムが特定の変数を強調して学習してしまうため、予測結果にバイアスが生じてしまうこと
アルゴリズムバイアス
性別、国籍、人種などの属性のこと
センシティブ属性
他のデータから見て極端に大きな値、または極端に小さな値のこと
外れ値・Outlier
外れ値のうち、極端な値をとる原因がわかっているもの
異常値・Abnormal Value