商品情報
商品説明
内容紹介
※この商品は固定レイアウトで作成されており、タブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字列のハイライトや検索、辞書の参照、引用などの機能が使用できません。※PDF版をご希望の方はGihyo Digital Publishingも併せてご覧ください。
◆高品質なデータを設計・開発する技術◆
Data-centric AIとは、機械学習の権威でありGoogleのAI研究チームを率いたAndrew Ngが2021年に提唱した、モデルよりもデータに主眼を置くというAI開発のアプローチです。過去数十年にわたりAI開発においては、固定されたデータセットに対してニューラルネットワークをはじめとしたモデルを適用し、そのモデルを改善することに関心が寄せられていました。しかし、このモデルを中心としたアプローチでは、データセットへの過度な依存やデータセットが抱える課題への無意味な適合により、実用において期待ほどモデルの性能が改善しないといった問題が指摘されています。そのため近年はモデルを固定したうえで、データ拡張、アノテーションの効率化や一貫性の担保、能動学習といったデータに工夫を加えることによってモデルの性能を向上させるアプローチに注目が集まっています。本書では、Data-centric AIの概要を解説したあとに、画像認識、自然言語処理、ロボットといった分野におけるデータを改善するための具体的なアプローチを解説します。最終章では、企業における実践的な取り組みを紹介します。
■こんな方におすすめ
・データセットの作成、データの学習方法に興味のある方
・基盤モデルに興味がある方
■目次
●第1章 Data-centric AIの概要
1.1 Data-centric AIとは
1.2 データセットのサイズとモデルの性能の関係
1.3 データの品質の重要性
1.4 おわりに
●第2章 画像データ
2.1 画像認識におけるData-Centric AIとは
2.2 画像認識モデルの基礎知識
2.3 データを拡張、生成する技術
2.4 不完全なアノテーションからの学習
2.5 画像と言語ペアの関係性を学習した基盤モデル
2.6 能動学習
2.7 おわりに
●第3章 テキストデータの収集と構築
3.1 言語モデルの事前学習
3.2 事前学習データの収集
3.3 ノイズ除去のためのフィルタリング
3.4 データからの重複除去
3.5 テキストデータ収集の限界
3.6 おわりに
●第4章 大規模言語モデルのファインチューニングデータ
4.1 ファインチューニングとは
4.2 Instruction Data
4.3 Preference Data
4.4 ファインチューニングモデルの評価
4.5 日本語における大規模言語モデルのファインチューニング
4.6 おわりに
●第5章 ロボットデータ
5.1 はじめに
5.2 RTシリーズの概要
5.3 多様なロボット
5.4 ロボットにおけるデータ収集
5.5 データセット
5.6 データ拡張
5.7 おわりに
●第6章 Data-centric AIの実践例
6.1 テスラ
6.2 メタ
6.3 チューリング
6.4 LINEヤフー
6.5 GO
6.6 コンペティションとベンチマーク
6.7 Data-centric AI実践のためのサービス
6.8 おわりに
■著者プロフィール
片岡裕雄(かたおかひろかつ):2014年 慶應義塾大学大学院 博士(工学)。2024年現在、産業技術総合研究所 上級主任研究員、オックスフォード大学 Academic Visitor および cvpaper.challenge 主宰。時空間モデルのベースライン3D ResNetの研究開発,実データ不要の事前学習法 数式ドリブン教師あり学習(Formula-Driven Supervised Learning; FDSL)を提案。2019/2022年度AIST Best Paper、2020年 ACCV 2020 Best Paper Honorable Mention Award、2023年 BMVC 2023 Best Industry Paper Finalist。研究はMIT Technology Reviewや日経等メディアにて掲載。本書の監修を担当。
宮澤一之(みやざわかずゆき):GO株式会社にてコンピュータビジョン技術の研究開発や実装を担うチームのリーダーを務める。2010年に東北大学にて博士号を取得後、三菱電機株式会社に入社し、映像解析や自動外観検査などの研究開発に携わる。2019年より株式会社ディー・エヌ・エーにてモビリティ向けのコンピュータビジョン技術の研究開発およびチームマネジメントに従事し、2020年に同社が関わり設立された株式会社Mobility Technologiesに転籍。2023年4月にGO株式会社へ商号変更。プライベートでは、1,200人以上のメンバーが所属するData-Centric AI Communityを運営し、定期的な勉強会を開催している。本書の1章、6章の執筆を担当。
齋藤邦章(さいとうくにあき):OMRON SINIC X Corporation シニアリサーチャー。2018年に東京大学情報理工学系研究科創造情報学専攻の修士課程を修了し、アメリカBoston UniversityのComputer Science専攻の博士課程に進学。Nvidia, Meta, Googleでリサーチインターンを経験。大学およびインターン先では、ドメイン適合、半教師付き学習、画像生成、Vision-Languageに関する研究を行い、2023年に博士号を取得。2023年より現職。現在は画像と言語両方に関わる研究に従事。本書の2章の執筆を担当。
清野舜(きよのしゅん):SB Intuitions株式会社 シニアリサーチエンジニア。2022年に東北大学大学院情報科学研究科博士後期課程を修了し、博士(情報科学)を取得。2019年より理化学研究所革新知能統合研究センターにて勤務したのち、 2022年にLINE株式会社 (現: LINEヤフー株式会社) に入社。2024年より現職。現在は主に大規模言語モデルの研究開発に従事。本書の3章の執筆を担当。
小林滉河(こばやしこうが):SB Intuitions株式会社 チーフリサーチエンジニア。2021年に筑波大学大学院図書館情報メディア研究科修士課程修了。同年よりLINE株式会社 (現: LINEヤフー株式会社) に入社。2024年より現職にて、大規模言語モデルのファインチューニングに関する研究開発およびチームマネジメントに従事。本書の4章の執筆を担当。
河原塚健人(かわはらづかけんと):東京大学大学院情報理工学系研究科特任助教。2017年に東京大学工学部機械情報工学科を卒業、2019年・2022年に東京大学大学院情報理工学系研究科知能機械情報学専攻の修士課程・博士課程を修了し、博士(情報理工学)を取得。2022年より現職。筋骨格ヒューマノイドの身体設計と制御, 深層学習に基づく知能ロボットシステムの研究に従事。本書の5章の執筆を担当。
鈴木達哉(すずきたつや):2020年に上智大学大学院理工学研究科を修了後、株式会社ディー・エヌ・エーに入社。現在はGO株式会社へ出向し、コンピュータビジョンに関する研究開発に従事。プライベートでは、Data-Centric AI Communityの運営に参加し、定期的な勉強会を開催。本書の6章の執筆を担当。
商品レビュー(1件)
- 総合評価
楽天Koboのレビュー
まだレビューがありません。 レビューを書く
楽天ブックスランキング情報
-
週間ランキング
ランキング情報がありません。
-
日別ランキング
ランキング情報がありません。