2022年2月23日水曜日

丸11〜10 lT活用の動向〜統計情報

 丸山1 新技術とデーターサイエンス2

11ーー数値解析、最適化

ページランク 被リンクページを上に表示(線形代数でデータの重要成分抽出)
  線形代数 数値解析法でベクトルや行列を扱う。
ABCのページへのアクセスリンクの頻度で上位に(Google エンジンの表示など)

最適化問題 乗り換え案内など 強化学習

12ーー業務分析手法①
ABC分析 パレート図でデータの構成比率ーABCランク付け=重点対応点(高売上、ニーズが分かる)

パレート図 大から小へ、累積と重ね ??

特性要因図(魚の骨)  特性(品質が悪い)に対しての要因のカテゴリ分け(人、機械、材料等)、さらに具体的要因書込み
  不良品発生要因や事故の原因特定のため

レーダーチャート 蜘蛛の巣、バランス

管理図 上方(管理限界)、下方(管理限界)工程異常の確認グラフ

13ーー業務分析手法②
度数分布表/ヒストグラム バラつきのあるデータを範囲で区切り度数分布表を棒グラフに 普通は富士山型

分割表(クロス集計表) アンケートの集計など 行列に複数の項目

箱ひげ図 異なる複数のデータのバラつきを示す ?? 年収など

ヒートマップ データを強弱で色分け 府県別人口や降雪量

丸1〜10 lT活用の動向〜統計情報

丸山1 新技術とデーターサイエンス

 1ーーーーー

産業革命 1蒸気 2電力モーター 3コンピュータ 4次AI、IoT 

Society.   1.0狩猟  2.0農耕  3.0工業  4.0情報  5.0人間中心社会(経済発展と社会課題解決両立を目指すデータ駆動型社会)

Poc(proof of concept)概念実証 試作品で検証しリスク排除 開発前検証

データ連携基盤整備事業 スーパーシテイ法(国家戦略特区法)

ICT インフォ &コミ テクノロジー

2ーーーーー
機械学習 教師ありーー事前サンプル学習 教師なしーーpcが特徴分類 オススメ紹介など

強化学習 pc試行錯誤でルール、パターン 適切な行動 囲碁、エレベーター制御

デープラーニング 深層学習 顔、音声認識、自動運転、チャットボット 複雑な認識と識別

3ーーーーー
AIの活用 データから売上予測 知識発見(データから病気の予兆) 原因究明(事故) 計画策定(売上Dから売上計画) 
              判断支援(医療画像診断支援)  活動代替(車の自動走行制御システム)

4ーーーーー
人間中心のAI社会原則検討会議
 基本原則  人間中心(利用の判断決定は人)  教育とリテラシー(格差、弱者配慮)  プライバシー確保 セキュリティ確保


       公正競争確保  公平性、説明責任、透明性 イノベーションの原則(国際化と多様化、産学連携)

「信頼できるAIのための倫理ガイドライン」 欧州連合EU(合法的、倫理的、セキュリティ確保)

「人工知能学会倫理指針」 人工知能研究者に対する指針

5ーーーーー
社会的バイアス 収入と男女の内訳 (与信審査)

悪意によるバイアス

アルゴリズムのバイアス 機械学習で多数派尊重傾向

AIの責任論 トロッコ問題 未解決

デジタルデバイド 情報化による格差(環境や能力)

イノベーションのジレンマ 革新を避けシェアを落とす(既存技術に執着して)

ロングテール たまに売れても長期には大きな割合を占めてしまう。??

6ーーーーー
メタデータ データのデータ
  
ビッグデータ
構造化データ 顧客や商品データの表(列行で管理)
非構造化データ 画像音声動画(非定型的)

名寄せ 重複データを1に 
アノテーションータグ付け作業

7ーーーーー
A/Bテスト 2パターンの比較検証

8ーーーーー
BIツール(ビジネス インテリジェンス) データ可視化し素人分析、点在データから短時間でレポート

DWH(データ ウエア ハウス) データを時系列に保存 削除されない。

データマイニング データの集積から新情報を

BPRビジネス プロセス re-engineering 既存の組織やビジネスルールを見直し再設計

EA enterprise architecture 業務、システムを統一的にモデル化し改善する。

SOA service oriented archiecture   サービスの組合せでシステム構築 
  既存システムの機能再利用できる サービス志向アーキテクチャ

9ーーーーー
テキストマイニング 単語の頻度、種類分析 口コミやアンケートの評価など

データサイエンティストのスキル 
ビジネスの課題を整理し解決 データ分析の知識理解活用 
データ分析で新サービスや価値創造のヒントアイデアの抽出

ITストラジスト lT活用した経営戦略立案とlT戦略を主導(経営陣に近い人)
システムアーキテクト システム開発に必要な要件定義し、アーキテクチャを検討し開発を主導すると人
システムアナリスト 情報システムの評価、分析者

10ーーーーー

偏差値 平均値の偏差値50 平均からどの位置にある数値か
標準偏差値 平均からどのくらいの幅でデータがバラついているか 大きい値ほどバラつきが大きい。

中央値 奇数このとき真ん中の値 偶数個では中央2個を÷2

相関係数 ー1〜+2までの実数 ー負の相関 +正の相関がある。 0に近いと相関弱い。
  関係性の強さ

散布図 点のバラつき 正負の相関 バラバラ相関なし 気象情報と収穫量など
  事実関係

回帰分析 説明変数(原因)気象情報から目的変数(予想される結果)収穫量
  事実から将来予測 身長(説明変数)から体重(目的変数)を予測

4情報の単位、2進数 D表現

情報の単位と計算 

8bitで1bye  32bitは4byte



接頭語 P T G M K 1  左へ10の3乗倍(000増える) 1GBは10の9乗倍(1000 000 000

             右へ10の3乗倍分の1(000減る)  GはKの10の6乗倍です。


10進数  箱の大きさ9個  2進数は箱の大きさが1個(何も無いのが0だから)

              箱の大きさ1bit

 (8の位が何個)(4の位が何個)(2の位が何個)(1の位が何個あるか)

                 ×2で4の位へ   ×2で2の位へ

              (10)(2)では  4が1つ  2が1つ  1が1つ      

                            ※ で 7個で1 11

A/D変換=符号化 標本化(時間軸を縦線で区切る) 量子化(縦線の量レベルを2進数で)

文字コード 2進数に対応させた文字の表

圧縮  10111111110011111111111100 多くのbit数必要なので、
    10,18,02,112,02(連続するところを簡単表記で取り除く)可逆圧縮

     CDの不可聴音域のカット=不可逆圧縮

2022年2月21日月曜日

2進数の計算、論理積と和の計算

2進数のたし算二進数の足し算(ひっ算)1

二進数の足し算(ひっ算)2

2進数の引き算
2進数の引き算

2進数のかけ算

2進数の掛け算

2進数の掛け算

2進数の割り算

二進数の割り算もひっ算で計算できます。

2進数の割り算



以下どうなんだ?

繰り上がりがない例

二進法で表された数 10 と 101 のかけ算を計算してみましょう。
二進数のかけ算の例

図のように、十進数の場合と全く同じように筆算で計算することができます。

答えは、1010 となります。

筆算を使わずに、十進数に変換してから計算することもできます。

10 という二進数を十進数に直すと 2 になります。
101 という二進数を十進数に直すと 22+1=5 になります。
これらを十進数の世界でかけ算すると、2×5=10 になります。

10=23+2 なので、これを二進数に戻すと 1010 になります。

繰り上がりがある例

二進法で表された数 1011 と 101 のかけ算を計算してみましょう。
繰り上がりがある二進数のかけ算の例

図のように、十進数の場合と全く同じように筆算で計算することができます。
ただし、繰り上がりに注意が必要です。1+1 は二進数の世界では 10 です。つまりその桁は 0で、繰り上がりが 1 となります。

答えは、110111 となります。

十進数に変換してから計算することもできます。

1011 という二進数を十進数に直すと 23+2+1=11 になります。
101 という二進数を十進数に直すと 22+1=5 になります。
これらをかけ算すると、5×11=55 になります。
これを二進数に戻すと 55=32+16+4+2+1 なので、110111 になります。

論理積 0があったら0、1と1で1

79_2.gif/image-size:344×67

論理和 1があったら1、0と0は0

OR演算(オアえんざん)の機能は,英語のORの意味そのもので,、「~か」という意味です。そのため、OR演算結果では、二つのうち1つのどちらかが1であれば、答えは1になります。これは、足し算の性質と大変似ているため、論理和と呼ばれます。ただ、実際の足し算と違うのは、両方が「1」でも、桁上がりが起きないということです。

では、実際に8ビットの論理和の例を見てみましょう。ANDの場合と同様に、01101101と、11110000のOR演算を行ってみます。複数の桁がある場合は、対応けた同士でそれぞれOR演算を行います。その結果、得られる答えは11111101となります。(図6-2.)

図6-2.8ビットのOR演算

丸11〜10 lT活用の動向〜統計情報

  丸山1 新技術とデーターサイエンス2 11ーー数値解析、最適化 ページランク 被リンクページを上に表示(線形代数でデータの重要成分抽出)   線形代数 数値解析法でベクトルや行列を扱う。 ABCのページへのアクセスリンクの頻度で上位に(Google エンジンの表示など) 最適...