G検定 ~「DIVE INTO EXAM」編~

暗記

mer0 2021年11月07日 カード155 いいね1

ビューア設定

[Enter]でカードをめくります。キーボードショートカット

G検定 ~「DIVE INTO EXAM」編~
  • Alexa
    Amazon Echoが搭載している音声認識エージェント
  • Google Assistant
    Google Homeが搭載している音声認識エージェント
  • Clova
    Clova WAVEが搭載している音声認識エージェント
  • Cortana
    Invokeが搭載している音声認識エージェント
  • siri
    HomePodが搭載している音声認識エージェント
  • LOD(Linked Open Data)
    ウェブ上でコンピュータ処理に適したデータを公開・共有するための方法
  • GDPR(General Data Protection Regulation)
    2018年に運用開始されたEU一般データ保護規則の正式名称
  • ミニバッチ学習
    小さなグループに分割した訓練データを逐次的に用いて学習する手法
  • オンライン学習
    訓練データをランダムに1件ずつ逐次的に用いて学習する手法
  • バッチ学習
    全訓練データを投入して学習する手法
  • PDS(personal data store)
    個人情報やライフログを個人自身が蓄積・管理して、企業に販売したり、情報銀行に委託したりする仕組み
  • 情報銀行
    PDSなどのシステムを活用して個人のデータを管理するとともに、個人の指示又は予め指定した条件に基づき、個人に代わり妥当性を判断の上、データを第三者(他の事業者)に提供する事業及び事業者
  • レベル4
    「官民 ITS 構想・ロードマップ 2020」において、自家用車が2025 年までに目指している自動運転のレベル
  • 「人間の尊厳」、「多様性・包摂性」、「持続可能性」
    内閣府が公表した「人間中心の AI 社会原則」の基本概念
  • モラベックのパラドックス
    人間にとって簡単なことほど機械がやるのは難しいと呼ばれる考え
  • 限定提供データ
    2018年に不正競争防止法等の一部を改正する法律が成立し、2019年7月に施行された。この改正によって、「業として特定の者に提供する情報として電磁的方法により相当量蓄積され、及び管理されている技術上または営業上の情報」が保護されるようになった情報
  • スタッキング
    アンサンブルの手法の一つであり、モデルを積み上げていく方法
  • イテレーション数
    機械学習の学習の過程で、パラメータが更新された回数を示す語句
  • レバザーコンピューティング
    大自由度力学系が示す多様な時空間パターンを活用したモデル。溜め池に投げた石によって生じる波紋の形状から投げた情報を予測できるという考え方。
  • OpenCV
    当初Intelが開発した画像認識ライブラリであり、2006年に1.0がリリースされ、2015年には3.0がリリースされている。
  • arXiv(アーカイヴ)
    コーネル大学が運営元である様々な論文が保存・公開されているウェブサイト。
  • 研究論文の公開・閲覧
    コーネル大学が運営元であるarXivが提供するサービス
  • 学習器
    訓練用データから学習されたモデル
  • 汎化性能
    未知のデータに対する推論の精度のこと
  • AAAI
    米国で開催されている人工知能分野における国際会議の名称
  • JSAI
    日本の学術研究団体のひとつ。人工知能に関する研究の進展や正しい知識の普及などの活動を通じて、社会の発展に寄与することを目的として1986年に設立。
  • グリッドサーチ
    ハイパーパラメータのチューニング手法の1つである、初期パラメータを複数用意し、それぞれで学習を行いパラメータを決定する手法。
  • KLダイバージェンス
    2つの確率分布がどの程度似ているかを表す尺度
  • Inceptionモジュール
    3つの異なるサイズの畳み込みフィルタ(1x1、3x3、5x5)と3x3のmaxプーリングから構成されているモジュール。評価力を維持したままパラメータ数を削減することができる。GoogleNetの特徴の1つにこのモジュールを積み上げた構造をしている。
  • Coursera(コーセラ)
    スタンフォード大学の関係者によって設立された教育技術の団体であり、AIを含めた様々な分野の講義をオンラインで提供
  • Udemy
    プロの成人と学生を対象としたアメリカの大規模オープンオンラインコース(MOOC)プロバイダー。創始者エレン・バリとオクタイCaglar
  • AlexNet
    ILSVRCにて初めて深層学習の概念を取り入れたモデル。2012年ILSVRCで1位
  • GoogleNet
    Inceptionモジュールと呼ばれる小さなネットワークを積み上げた構造をしている。2014年ILSVRCで1位
  • VGG16
    13層の畳み込み層と3層の全結合層の合計16層から構成されるモデル。2014年ILSVRCで2位
  • ResNet
    層を飛び越えた結合(Skip connection)があることが特徴のモデル。2015年ILSVRCで1位
  • DenseNet
    2016年に発表されたモデルで、前方の各層からの出力全てが後方の層への入力として用いられるのが特徴。Dense Blockと呼ばれる構造を持つ。
  • 物体検出
    画像に写っている物体をバウンディングボックスと呼ばれる矩形の領域で位置やクラスを認識するタスク
  • R-CNN
    2014年に発表されたCNNを用いた物体検出モデル。
  • YOLO
    物体検出手法の一つ。検出と識別を同時に行うのが特徴。
  • SSD
    物体検出の手法で、特徴の一つに小さなフィルタサイズのCNNを特徴マップに適応することで、物体のカテゴリと位置を推定することが挙げられる。
  • Faster R-CNN
    2015年にMicrosoft社が開発した物体検出アルゴリズム。
  • SegNet
    2017年に提案されたセマンティックセグメンテーションを行う手法の一つ。入力画像から特徴マップの抽出を行うEncoderと抽出した特徴マップと元の画像のピクセル位置の対応関係をマッピングするDecoderで構成されている手法。
  • セマンティックセグメンテーション
    画像に写っているものをピクセル単位で領域やクラスを認識するタスク。物体領域を種類ごとに抽出する。
  • インスタンスセグメンテーション
    画像に写っているものをピクセル単位で領域やクラスを認識するタスク。個別の物体領域を抽出する。
  • U-Net
    セマンティックセグメンテーションを行う手法の一つ。全層畳み込みネットワーク(FCN)の一種で、畳み込まれた画像をdecodeする際にencodeで使用した情報を用いるのが特徴。
  • bag of words(BoW)
    どの単語が含まれるかに注目して単語をベクトル化する方法。
  • TF-IDF
    2つの情報から単語の重要度を算出する方法。トピック分析などで利用。 2つの算出方法とはTFとIDF
  • トピックモデル
    文書や単語に潜む潜在的なカテゴリを説明するモデル。
  • LDA(潜在的ディリクレ配分法)
    文書集合から各文書におけるトピックの混合比率を推定する手法の一つ。各トピックから単語が生成される確率もトピックと同時に推定する。
  • word2vec
    単語の分散表現を獲得する、NWを用いた推論ベースの手法。
  • doc2vec
    文書の分散表現を獲得する、NWを用いた推論ベースの手法。
  • Transformer
    Google社が2017年に発表した「Atention is All You Need」という論文で登場した言語モデル。
  • BERT
    Google社が2018年に発表した双方向Transformerを使ったモデルで、事前学習に特徴がある。
  • MLM(Masked Language Model)
    BERTにも用いられている事前学習タスクで、文中の複数個所の単語をマスクし、本来の単語を予測する。
  • NSP(Next Sentence Prediction)
    BERTにも用いられている事前学習タスクで、2文が渡され、連続した文かどうか判定する。
  • GPT-2
    OpenAIが2019年に発表したTransformerベースのテキスト生成モデル。800万のWEBページを学習。
  • ケプストラム
    音声認識で使用される特徴量の一つ。音声信号に対し、フーリエ変換を行った後、対数を取り、もう一度フーリエ変換を行い、作成。
  • メル尺度
    人間の音声知覚の特徴を考慮した尺度で、この尺度が同じ時、人が感じる音高(ピッチ)の差が同じになる。
  • 音高
    ヒトの聴覚が感じる音の高低を示す心理量
  • マルコフ過程
    確立モデルの一つ。マルコフ性(ある時刻の状態がその直前の状態によってのみ決まる)を持つ確率過程(時間とともに変換する確率変数)
  • 隠れマルコフモデル(HMM)
    観測されない隠れた状態を持つマルコフ過程。
  • 損失関数(誤差関数)
    「正解値」と、モデルによる出力された「予測値」とのズレの大きさを計算するための関数である。誤差逆伝播法の最適化処理で用いられる。
  • コスト関数
    損失関数に正則化(=過学習を避けるためにモデルの複雑さにペナルティーを与えるテクニック)を加味した関数。損失関数と同じ意味で使用されることもある。
  • 目的関数
    誤差関数/損失関数/コスト関数などを含むより一般的な概念/用語
  • CTC(Connectionist Temporal Classification)
    音声認識などで用いられる損失関数。LSTMやRNNなどでEnd-to-Endに音声認識を行う際に用いられる。
  • WaveNet
    2016年にDeepMind社によって開発された音声合成・音声認識に使われるモデル。PixelCNNというモデルをベースにしている。
  • REINFORCE
    一連の行動による報酬和で方策を評価して、直接方策を改善する方策勾配法系のアルゴリズム。
  • deepfake
    GANなどを用いて人物の画像や映像を合成する技術。既存の画像と映像を、元となる画像または映像に重ね合わせて、非常に自然に合成を取る事が可能。
  • 透明性レポート
    IT企業などは、利用者のデータをどのように収集し、活用しているのか示したもの。
  • 多数決
    k近傍法は、与えられた学習データをベクトル空間上にプロットし、未知のデータに対し、そこから距離が近い順に任意のk個を取得し、その(●)でデータが属するクラスを推定する。
  • 自動運行装置
    2019年5月の道路運送車両法の改正によって、追加となった保安基準の対象装置
  • ZB(ゼタバイト)
    IDCの調査によると、2017年の1年間に生成されたデジタルデータは23(●)であった。
  • マイカー
    自家用自動車
  • シームレス
    途切れのない
  • MaaS(モビリティ・アズ・ア・サービス)
    「ICTを活用してマイカー以外の移動をシームレスにつなぐ」概念
  • TD学習(Temporal Difference learning)
    強化学習の手法の一つで、価値ベースの手法。TD誤差が0になる様な行動価値関数を用いてQ値を決定
  • LSI(Latent Semantic Indexing)
    トピックモデルの手法の1つとして、テキストデータに特異値分解を適用した手法。
  • ImageNet
    画像認識研究のための研究用標準データセット
  • ELSI(Ethical, Legal and Social Issues) ※エルシー
    AIの社会実装する際に生じうる、技術的課題以外のあらゆる課題(倫理的・法的・社会的課題)
  • 誤差逆伝播
    ニューラルネットワークを高速に学習させる方法として(●)があり、出力ノードから前方のノードへと伝播するように学習を行う。
  • 中国、米国、韓国、日本
    2018年時点でのAI関連の特許出願数が多い国(韓国、日本、米国、中国)の順序
  • 推論
    機械学習には大きく2つのプロセスがあり「学習」のプロセスと「(●)」のプロセスがあり、「(●)」は「学習」で生成した「推論モデル」に当てはめて、その結果を導くプロセスとなる。
  • TensorFlow
    Googleが開発した機械学習に用いるためのソフトウェアライブラリ
  • PyTorch
    Facebookが開発を主導したPython向けの機械学習ライブラリ
  • Caffe
    カリフォルニア大学バークレー校で開発されたディープラーニングのフレームワーク
  • 準委任
    民間企業でAIを開発する際に用いられる契約の1つに(●)契約があり、特にシステム開発における一部の開発を委託する場合はSES契約という。
  • Chainer(チェイナー)
    日本のIoT分野での活用を中心にディープラーニングの研究と開発を行うスタートアップ企業。同社の代表取締役社長である西川徹、岡野原大輔らが設立
  • ベイズの定理
    添付画像の式を示す定理
  • Kaggle
    企業や研究者がデータを投稿し、世界中の統計家やデータ分析家がその最適モデルを競い合う、予測モデリング及び分析手法関連プラットフォーム及びその運営会社
  • コンペティションへの参加
    Kaggleが提供するサービス
  • IEEE Spectrum
    世界最大の工学と応用科学の学会であるIEEEのエンジニア向け論文誌
  • NIPS(NeurlPS)
    AI(人工知能)分野の有力な国際学会。ニューラルネットワーク技術を主にテーマとしている学会であるが、近年は機械学習をテーマにした発表が増加。
  • ニューラル常微分方程式
    (●)は、ResNetの課題であった多くのメモリと時間を要する課題を解決するため、中間層を微分方程式として捉える手法であり、NIPS2018のベストペーパーに選ばれた。
  • コサイン類似度
    自然言語処理などで利用されている2つのベクトル間の類似度の指標で、-1~1の範囲をとる
  • OCR
    印刷された文字や手書きの文字を画像として読み込み、テキストデータ化する(●)技術にディープラーニングの技術を活用する取り組みが進んでいる。
  • 30m
    ドローンの飛行規制について、人または物件との間に(●)以上の距離を保って飛行させること。
  • ノイマン型コンピュータ
    プログラムをデータとして記憶装置に格納し、これを順番に読み込んで実行するコンピュータ
  • ノイマン
    近年のAIコンピュータでは、従来の(●)型コンピュータに対し、非(●)型コンピュータが注目を浴びている。具体例として、ニューロコンピュータや量子コンピュータがある。
  • GNMT (Google's Neural Machine Translation)
    Googleは2016年からディープラーニングを用いたアルゴリズムである(●)をGoogle翻訳に取込、翻訳の精度を向上させた。
  • Colaboratory(Colab※コラボ)
    インストール不要かつ、ブラウザからすぐにPythonや機械学習・深層学習の環境を整えることが出来る無料のサービス
  • 赤池情報量規準
    統計モデルの良さを評価するための指標の1つ
  • マルチメディア
    アニメーション、ビデオ映像、静止画、音声、文字などの情報をデジタルデータ化して、ユーザーの意志に応じてコンピュータ上で一括処理して組み合わせ、効果的に提供するシステム。 例 PC
  • マルチモーダル
    ロボティクスの分野でも、ロボットの動作を覚えさせるために強化学習の活用が進んでおり、各種センサから取得した(●)な情報に対してディープラーニングを活用する動きが進んでいる。
  • 画像キャプション生成
    1枚の画像を入力として,その画像中で行われている出来事や人物・動物などの振る舞いなどを説明するキャプション(caption)の文章を生成する問題
  • 決定係数
    回帰分析などで、データに対する推定された回帰式の当てはまりの良さを表す係数
  • 順伝播型ネットワーク
    情報が入力側から出力側に一方向にのみ伝搬させていくネットワークのこと。
  • t-SNE
    次元圧縮の手法で、データの局所的な構造をうまく捉えることができるだけでなく、さまざまなスケールのクラスタなど、大域的な構造も保った可視化ができる点が特徴の手法。
  • ビジネス力、データサイエンス力、データエンジニアリング力
    データサイエンス協会では、データサイエンティストに求められるスキルセット3つ
  • ICJI
    記号推論などの伝統的なテーマを含む人工知能技術全般をテーマとしている学会
  • CVPR(Computer Vision and Pattern Recognition)
    画像認識を主にテーマとしている学会
  • DeepFace
    Facebookの研究グループらが2014年に公表したディープラーニングを用いた顔認識システム
  • DARPA
    2016年8月にXAI(Explainable AI:説明可能なAI)への投資プログラムを発表した団体
  • 9
    6×6ピクセルの画像に、ストライド幅2で2×2ピクセルのプーリングをパディングなしで適用した場合、プーリングの適用回数
  • 汎化誤差
    まだ手に入れていないデータを予測した時の誤差
  • バイアンス
    汎化誤差の3つの要素の1つであり、予測モデルが複雑すぎることが原因で発生する。
  • バイアス
    汎化誤差の3つの要素の1つであり、予測モデルが単純すぎることが原因で発生する。
  • ノイズ
    汎化誤差の3つの要素の1つであり、どうやっても減らすことができない誤差。
  • Adversarial Examples(敵対的サンプル)
    人間では認識しづらいが、AIが認識を誤るような情報を加えたデータ
  • CycleGAN、AttnGAN、StyleGAN
    生成モデルの1つの手法であるGANを応用したアルゴリズム3つ
  • Define-by-Run
    ニューラルの設計を動的に行う(●)を実施することで、計算グラフの構築と順伝播処理の実行が同時に行える。
  • 中国、米国、インド、日本
    2018年時点でのAI関連の論文発行数が多い国(日本、インド、中国、米国)の順序
  • t分布
    SNEを改良したアルゴリズムであるt-SNEのtの意味を
  • スマートフォンや携帯電話を手に持っての操作
    2019年5月の道路交通法の改正によって、自動運転中に条件付きで認められるようになったことと
  • AI-Ready
    AIを人間が有効かつ安全に利用できる状態のことです。 AIが人間社会に与えるインパクトは非常に大きいことから、人間中心のAI活用が国の指針。
  • AI-Powered
    AI搭載
  • PB、EB、ZB、YB
    バイト単位の小さい順 候補:EB(エクサバイト)、PB(ペタバイト)、YB(ヨタバイト)、ZB(ゼタバイト)
  • Partnership on AI
    2016 年に、AI の研究や検証、実動におけるベストプラクティスを開発したり共有したりすることを目的とした非営利団体である(●)がFacebook、Amazon、Alphabet(Google)、IBM、Microsoft の5 社によって創設された。
  • 移動平均
    時系列データを平滑化する手法。株価や外国為替のテクニカル分析に使用される。
  • モーメンタム
    最適化アルゴリズムの一つ。移動平均で振動を抑制する手法。
  • RMSProp
    最適化アルゴリズムの一つ。学習率を調整して振動を抑制する手法。
  • 最適化アルゴリズム
    ディープラーニングにおいて、主に損失関数の最小値(とその時のパラメータ)を求めるアルゴリズム。
  • 最急降下法
    最適化問題の勾配降下法のアルゴリズムの一つ。 傾きの最も急な方向に降下することを意味し、最小二乗法をより一般化した最適化アルゴリズム。
  • Adam
    最適化アルゴリズムの一つ。モーメンタム+RMSProm
  • スラック
    SVMなどのアルゴリズムで、一部の誤分類を寛容にするため使用される変数
  • アフィン変換
    画像の拡大縮小、回転、平行移動などを行列を使って座標を変換する事
  • リカレント教育
    「生涯を通じて学び続けていくこと」です。 正確に表現すると、学校を卒業して仕事に就いても学ぶことをやめず、仕事と交互に教育を受けていくこと。
  • 割引率
    強化学習における、将来もらえる報酬をどれくらい現在の価値として考慮に入れるかを表すパラメータ。報酬は未来にいくほど小さくなる。
  • スパース化
    元のベクトルや行列の性質を残しつつ、値のほとんどを0にしてしまうこと
  • ホールド・アウト
    機械学習におけるデータのテスト方法の1種であり、訓練データを「学習用」と「評価用」に分割して、学習済みモデルの精度を測定する方法
  • 学習主体
    強化学習における「エージェント」の意味
  • End-to-End Learning
    例えば、画像認識であれば画像からいろいろなタスクを踏んで文字認識をするのが一般的な手法ですが、添付画像の通り画像から文字認識まで一気に学習させる手法のこと
  • Ver2.0
    経済産業省、総務省およびIoT 推進コンソーシアムでは、カメラ画像の利活用促進のために2017年にカメラ画像利活用ガイドブックを策定しており、2018年に策定したバージョン
  • コンソーシアム
    2つ以上の個人、企業、団体、政府から成る共同事業団体
  • Society5.0
    日本政府が提唱した、仮想空間と現実空間を高度に融合させたシステムにより、経済発展と社会的課題の解決を両立する、人間中心の社会の在り方。
  • データバイアス問題
    人に代わりデータ駆動型意思決定が行われる場合、学習データに内在する隔たりや偏見が判定に影響する問題。
  • ID・パスワード
    不正競争防止法等の改正によって、データの利活用を促進するための環境が整備される。主要な措置事項として、(●)などにより管理しつつ相手方を限定して提供するデータを不正取得するなどの行為を新たに不正競争行為に位置づけている。
  • メタ学習
    複数のタスクの学習結果や学習過程を利用し新しいタスクの学習効率を上げるような学習手法
  • MAML(マムル)
    メタ学習のうちの一つ。良い初期値を学習する。
  • Neural Process
    メタ学習のうちの一つ。関数のメタ学習。
  • CIFAR-10 (サイファーテン)
    学習用に50,000枚、テスト用に10,000枚用意された10種類もしくは100種類に分類できる物体カラー写真(乗り物や動物など)のデータセット。
  • Fashion-MNIST
    学習用に60,000枚、テスト用に10,000枚用意された10種類に分類できる衣類品画像のデータセット
  • ディープブルー
    1997年、チェス世界チャンピオンを破ったIBMの開発したチェスAI
  • 学習率
    多層パーセプトロンにおける、ハイパーパラメータに該当する値
  • P値
    統計的有意性を判断する際に用いられる有意確率
  • 訓練
    ィープラーニングのモデルを勾配降下法によって学習させた際、(●)誤差を最小化するようパラメータが更新される。
  • テストする
よく頑張りました
暗記スタート