機械学習 (76件)

アクティブラーニング (Active Learning)
AIが「これ教えて」と人間に質問しながら効率よく学習する手法です。
アノテーション (Annotation / Labeling)
データに「これは何か」のラベルを人が手作業で付ける工程のことです。
RLHF (Reinforcement Learning from Human Feedback)
人間がAIに「この答え好き、こっちはダメ」と評価して躾ける手法です。
RLAIF (Reinforcement Learning from AI Feedback)
人間の代わりにAIがフィードバックを返す、RLHFのAI版です。
異常検知 (Anomaly Detection)
ふだんと違うパターンを見つける、機械学習の地味な定番タスクです。
HMM / 隠れマルコフモデル (Hidden Markov Model)
「目に見えない裏の状態」が時間とともに移り変わる、と仮定して系列データを扱う統計モデルです。
SFT (Supervised Fine-tuning)
「お手本のQ&A」を見せながらLLMを躾ける、ファインチューニングの基本形です。
F1スコア (F1 Score)
適合率と再現率を1つの数字にまとめた、分類モデルの定番評価指標です。
MNIST (MNIST)
手書き数字の画像データセット、機械学習の「Hello World」です。
エントロピー (Entropy)
「ばらつきの大きさ・予測しにくさ」を数値で表す情報理論の概念です。
A/Bテスト (A/B Test)
2つの案を実際のユーザーに同時に出して、どっちが効くか比べる手法です。
オプティマイザ (Optimizer)
損失を小さくする方向にパラメータを動かす「動かし方の流派」のことです。
ONNX (Open Neural Network Exchange)
モデルを別のフレームワーク間で受け渡すための、共通の中間ファイル形式です。
OCR (Optical Character Recognition)
画像の中の文字を読み取って、テキストに変換する技術のことです。
回帰 (Regression)
「数字を予測する」タイプの機械学習タスクのことです。
顔認識 (Face Recognition)
顔の特徴から「これは誰か」を当てるAI技術です。
過学習 (Overfitting)
練習問題を覚えすぎて、本番でこける現象のことです。
確率的勾配降下法 (Stochastic Gradient Descent (SGD))
毎回ランダムに少しずつデータを取って、勾配を計算する学習方式です。
活性化関数 (Activation Function)
ニューラルネットの中で「次の層にどう信号を渡すか」を決める関数です。
KAN (Kolmogorov-Arnold Network)
2024年に発表された、Transformer以来のNN代替候補と話題になった新型構造です。
学習 (Training)
モデルにデータを食わせて賢くする工程のことです。
学習データ (Training Data)
AIに学ばせる素材になるデータのことです。
学習率 (Learning Rate)
パラメータを「どれくらい大胆に動かすか」を決める設定です。
Q学習 (Q-Learning)
「この状況でこの行動を取ったら、最終的にどれくらい得か」を表にして学習する、強化学習の基本手法です。
QLoRA (QLoRA)
量子化とLoRAを組み合わせて、ノートPCでもLLMを微調整できるようにした手法です。
強化学習 (Reinforcement Learning)
試行錯誤させて、うまくいったら褒めて伸ばす方式です。
教師あり学習 (Supervised Learning)
「問題と正解のセット」をひたすら見せて学ばせる方式です。
教師なし学習 (Unsupervised Learning)
答えなしのデータから、勝手にパターンを見つけさせる方式です。
クラスタリング (Clustering)
似たもの同士を勝手にグループ分けする手法のことです。
決定木 (Decision Tree)
「もし◯◯なら△△」を木の形に並べて判断する、シンプルな機械学習モデルです。
k近傍法 (k-Nearest Neighbors (k-NN))
「近くにいる仲間の多数決」で答えを出す、シンプルな機械学習手法です。
勾配降下法 (Gradient Descent)
損失が小さくなる方向にパラメータを少しずつ動かす、学習の基本手順です。
勾配ブースティング (Gradient Boosting)
小さな決定木をたくさん作って合成する、強力な機械学習手法です。
合成データ (Synthetic Data)
AI自身や他の手段で「人工的に作り出した」学習データのことです。
再帰型ニューラルネットワーク (Recurrent Neural Network (RNN))
順番のあるデータ向けの、ちょっと昔のニューラルネット構造です。
差分プライバシー (Differential Privacy)
「個別データを特定できないが集計はできる」状態を数学的に保証する仕組みです。
サポートベクターマシン (Support Vector Machine (SVM))
「ふたつのグループの境界線」を引くのが得意な、古典機械学習の名選手です。
シグモイド関数 (Sigmoid Function)
数字を0〜1の範囲に押し込める、古典的な活性化関数です。
時系列予測 (Time Series Forecasting)
過去のデータから「未来の数字」を予測する、定番のMLタスクです。
自己教師あり学習 (Self-supervised Learning)
データの一部を隠して「当てる」ことで自分で学ぶ、賢い学習方式です。
蒸留 (Distillation)
大きい賢いモデルの「中身のエッセンス」を小さいモデルに移す技法です。
GRPO (Group Relative Policy Optimization)
PPOから「価値関数」をなくして、グループ内の相対比較で報酬を計算する、軽量化された強化学習手法です。
正則化 (Regularization)
過学習を防ぐために、モデルに「やりすぎ防止」のペナルティを課す仕組みです。
セグメンテーション (Segmentation)
画像の中の各ピクセルが「何に属するか」を塗り分けるタスクです。
センチメント分析 (Sentiment Analysis)
文章の「感情の向き(ポジ/ネガ)」を自動判定する技術です。
ソフトマックス関数 (Softmax Function)
数字の並びを「合計1の確率」に変換する関数です。
損失関数 (Loss Function)
AIの答えがどれくらい間違ってるかを数値で表す式のことです。
TF-IDF (Term Frequency - Inverse Document Frequency)
文章の中で「その文書らしさを表す単語」を見つけ出す、古典的な重み付け手法です。
テキスト分類 (Text Classification)
文章を「カテゴリ」に分類するNLPの定番タスクです。
テスト時計算 (Test-time Compute)
推論時に長く考えさせることで精度を上げる、最近の主流アプローチです。
転移学習 (Transfer Learning)
別の用途で学習した知識を、新しい用途に流用する手法のことです。
DPO (Direct Preference Optimization)
RLHFをもっとシンプルにした、選好データから直接学ぶ手法です。
データ拡張 (Data Augmentation)
元データを加工して「水増し」する技です。
データキュレーション (Data Curation)
学習に使うデータを「選んで、整えて、品質を担保する」工程のことです。
データドリフト (Data Drift)
時間とともに現実のデータが変化して、AIの精度が落ちていく現象です。
特徴量エンジニアリング (Feature Engineering)
生データから「機械学習が使いやすい数値」を作る職人技です。
DoRA (Weight-Decomposed Low-Rank Adaptation)
LoRAの精度をさらに上げた、重み分解型のファインチューニング技法です。
ハイパーパラメータ (Hyperparameter)
モデルの学習設定を決める「外から与える数字」のことです。
半教師あり学習 (Semi-supervised Learning)
少しのラベル付きデータと、大量のラベルなしデータの両方で学習する方式です。
パーセプトロン (Perceptron)
1957年に発明された、最も原始的なニューラルネットの先祖です。
BPE (Byte-Pair Encoding)
単語を「よく一緒に出る部品」に切り分ける、トークナイザーの定番アルゴリズムです。
ビームサーチ (Beam Search)
確率の高い候補を「k本ずつ枝分かれさせて」進める古典的な生成手法です。
PCA / 主成分分析 (Principal Component Analysis)
たくさんあるデータの特徴を、「いちばん効いてる軸」に絞って圧縮する手法です。
PPO (Proximal Policy Optimization)
強化学習の代表手法、ChatGPTのRLHFでも使われた重要アルゴリズムです。
ファインチューニング (Fine-tuning)
学習済みモデルを、特定用途向けにちょっと追加学習させる工程です。
物体検出 (Object Detection)
画像の中の「どこに何が写ってるか」を四角で囲って当てるタスクです。
分類 (Classification)
「これは何カテゴリか?」を当てるタイプの機械学習タスクです。
ベイズ統計 (Bayesian Statistics)
「新しい情報が来たら確率を更新する」考え方の統計手法です。
ミニバッチ (Mini-batch)
学習データをちょっとずつ小分けにして渡す方式の単位です。
模倣学習 (Imitation Learning)
人間のお手本動作を真似させてロボットに動きを覚えさせる手法です。
YOLO (You Only Look Once)
画像を一度見るだけで物体検出を済ませる、速さで有名なモデルです。
ランダムフォレスト (Random Forest)
決定木をランダムに大量に作って、多数決で答えを出す手法です。
量子化 (Quantization)
モデル内の数字を「ざっくり」表現して、サイズと計算量を減らす技です。
連合学習 (Federated Learning)
データを集めずに、各端末で学習結果だけを持ち寄る賢いやり方です。
LoRA (Low-Rank Adaptation)
大きいモデルの一部だけを軽く調整するファインチューニング手法です。
ワールドモデル (World Model)
AIが「世界はこう動く」という内部モデルを持って、未来をシミュレートできる仕組みです。