丸山1 新技術とデーターサイエンス
1ーーーーー
産業革命 1蒸気 2電力モーター 3コンピュータ 4次AI、IoT
Society. 1.0狩猟 2.0農耕 3.0工業 4.0情報 5.0人間中心社会(経済発展と社会課題解決両立を目指すデータ駆動型社会)
Poc(proof of concept)概念実証 試作品で検証しリスク排除 開発前検証
データ連携基盤整備事業 スーパーシテイ法(国家戦略特区法)
ICT インフォ &コミ テクノロジー
2ーーーーー
機械学習 教師ありーー事前サンプル学習 教師なしーーpcが特徴分類 オススメ紹介など
強化学習 pc試行錯誤でルール、パターン 適切な行動 囲碁、エレベーター制御
デープラーニング 深層学習 顔、音声認識、自動運転、チャットボット 複雑な認識と識別
3ーーーーー
AIの活用 データから売上予測 知識発見(データから病気の予兆) 原因究明(事故) 計画策定(売上Dから売上計画)
判断支援(医療画像診断支援) 活動代替(車の自動走行制御システム)
4ーーーーー
人間中心のAI社会原則検討会議
基本原則 人間中心(利用の判断決定は人) 教育とリテラシー(格差、弱者配慮) プライバシー確保 セキュリティ確保
公正競争確保 公平性、説明責任、透明性 イノベーションの原則(国際化と多様化、産学連携)
「信頼できるAIのための倫理ガイドライン」 欧州連合EU(合法的、倫理的、セキュリティ確保)
「人工知能学会倫理指針」 人工知能研究者に対する指針
5ーーーーー
社会的バイアス 収入と男女の内訳 (与信審査)
悪意によるバイアス
アルゴリズムのバイアス 機械学習で多数派尊重傾向
AIの責任論 トロッコ問題 未解決
デジタルデバイド 情報化による格差(環境や能力)
イノベーションのジレンマ 革新を避けシェアを落とす(既存技術に執着して)
ロングテール たまに売れても長期には大きな割合を占めてしまう。??
6ーーーーー
メタデータ データのデータ
ビッグデータ
構造化データ 顧客や商品データの表(列行で管理)
非構造化データ 画像音声動画(非定型的)
名寄せ 重複データを1に
アノテーションータグ付け作業
7ーーーーー
A/Bテスト 2パターンの比較検証
8ーーーーー
BIツール(ビジネス インテリジェンス) データ可視化し素人分析、点在データから短時間でレポート
DWH(データ ウエア ハウス) データを時系列に保存 削除されない。
データマイニング データの集積から新情報を
BPRビジネス プロセス re-engineering 既存の組織やビジネスルールを見直し再設計
EA enterprise architecture 業務、システムを統一的にモデル化し改善する。
SOA service oriented archiecture サービスの組合せでシステム構築
既存システムの機能再利用できる サービス志向アーキテクチャ
9ーーーーー
テキストマイニング 単語の頻度、種類分析 口コミやアンケートの評価など
データサイエンティストのスキル
ビジネスの課題を整理し解決 データ分析の知識理解活用
データ分析で新サービスや価値創造のヒントアイデアの抽出
ITストラジスト lT活用した経営戦略立案とlT戦略を主導(経営陣に近い人)
システムアーキテクト システム開発に必要な要件定義し、アーキテクチャを検討し開発を主導すると人
システムアナリスト 情報システムの評価、分析者
10ーーーーー
偏差値 平均値の偏差値50 平均からどの位置にある数値か
標準偏差値 平均からどのくらいの幅でデータがバラついているか 大きい値ほどバラつきが大きい。
中央値 奇数このとき真ん中の値 偶数個では中央2個を÷2
相関係数 ー1〜+2までの実数 ー負の相関 +正の相関がある。 0に近いと相関弱い。
関係性の強さ
散布図 点のバラつき 正負の相関 バラバラ相関なし 気象情報と収穫量など
事実関係
回帰分析 説明変数(原因)気象情報から目的変数(予想される結果)収穫量
事実から将来予測 身長(説明変数)から体重(目的変数)を予測