+ All Categories
Home > Documents > 調査報告書 - Minister of Economy, Trade and Industry ·...

調査報告書 - Minister of Economy, Trade and Industry ·...

Date post: 13-Aug-2020
Category:
Upload: others
View: 1 times
Download: 0 times
Share this document with a friend
123
平成 27 年度 経済産業省 石油精製業保安対策事業 (コンビナートにおける情報・データの活用を通じた自主保安の高度化に関する調査研究) 調査報告書 平成 28 3 国立大学法人 鳥取大学
Transcript
Page 1: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

平成 27 年度 経済産業省

石油精製業保安対策事業

(コンビナートにおける情報・データの活用を通じた自主保安の高度化に関する調査研究)

調査報告書

平成 28 年 3 月

国立大学法人 鳥取大学

Page 2: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆
Page 3: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

まえがき

高圧ガス事業では安全の確保が絶対条件であり、一度、重大事故が発生すれば、事業者

のみならず、周辺に大きな損害を与える。そこで、高圧ガスに関わる事故防止は、法令遵

守とともに、事業者の自主的な保安力の向上活動が広く進められている。

高圧ガス設備を有する事業所では、防災活動が積極的に行われており、発生する事故や

大事故の件数は極めて少ないが、発生する事故の原因は、設備や装置に起因するものに対

して、人に起因するヒューマンエラーによるものが比較的多い。各事業所では、ヒヤリハ

ット報告をはじめとして、多くの情報やプロセスデータ(ビッグデータ)が採取・蓄積さ

れている。それらの一部は各工程にフィードバックされて事故の発生を未然に防止してい

るが、その数は限定的である。また、ヒヤリハット報告は、その全てが直接事故に繋がる

ものではない。一方、大部分の操業が正常運転で行われている現実を考慮すると、そこに

未だ表出化していない事故の原因が内在している可能性がある。

そこで、本調査研究では,コンビナートの自主保安力の向上を目的として、モデル事業

所で実際に採取・蓄積された長期間(9 年間)分のビッグデータを、自然言語処理、各種デ

ータサイエンス、および知識体系化技術などの情報処理技術を用いて分析して、事故の発

生の予想や対策に関わる知識を気付きや注意喚起として表現する技術の実証研究を行った。

また、それらの技術や情報共有の有効性を示すための提言やそれらに繋がるプラットフォ

ームの試作や提案を行った。

本調査研究に関わる審議をいただいた「コンビナートにおける情報・データの活用を通

じた自主保安の高度化に関する調査研究専門委員会」の委員各位、また、調査研究を分担

いただいた再委託企業の方々に深く感謝いたします。

鳥取大学 大学院 工学研究科

Page 4: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

コンビナートにおける情報・データの活用を通じた自主保安の高度化に関する調査研究専

門委員会 名簿

【委員長】

中田 亨 産業技術総合研究所 人工知能研究センター 主任研究員

【委員】

岩間啓一 石油化学工業協会 技術部長

春山 豊 日本化学工業協会 常務理事 環境安全部長

敬称略 順不同

Page 5: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

抄 録

本調査研究では、モデル事業所のビッグデータを活用して、事故等の発生の予兆の検出

や事故等の発生を未然に防ぐための技術スタッフに対する気付きや注意喚起及び事業所内

における情報共有等に関する実証研究を行った。鳥取大学と3社の再委託企業による体制

で、モデル事業所におけるビッグデータ活用の有効性実証として、自然言語処理、データ

サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

検出や事故等の発生を未然に防ぐための技術スタッフに対する気付きや注意喚起等の実証

研究を行い、モデル事業所より「有効性有り」との評価を受けた。また、ビッグデータの

情報処理後の情報共有の有効性の調査研究では、上記によって得られた結果を踏まえ、情

報・データを共有するためのプラットフォームのプロトタイプを試作し、その有効性と課

題を明らかにした。さらに、ビッグデータ解析で得られる事業所視点でのインセンティブ

の検討と提言を行った。

キーワード

1章、2.1 節、2.3 節

ビッグデータ、ヒヤリハット報告、プロセスデータ、ベイジアンネットワーク、確率推論、

オントロジー、

2.2 節

系列ラベリング、テキスト構造化、連想検索

2.4 節

外れ値検出、マハラノビス距離、1 クラス SVM、

2.5 節

関数近似、モデル予測制御、高度予測制御

2.6 節

インセンティブ、KPI(Key Performance Indicator)、因果ループ図、PDCA サイクル

Page 6: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

目 次

まえがき

抄 録

キーワード

目 次

1. 調査概要 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 1

1.1 調査目的 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 1

1.2 調査方法 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 1

1.3 調査内容 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 2

1.3.1 調査内容(仕様)の概要 ・・・・・・・・・・・・・・・・・・・・・・・・・ 2

1.3.2 【Ⅰ】モデル事業所におけるビッグデータ活用の有効性実証の詳細 ・・・・・・ 2

1.3.3 【Ⅱ】ビッグデータの情報処理後の情報共有の有効性の調査研究の詳細・・・・・ 3

1.4 調査実施体制 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 3

1.5 調査分担 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 4

1.6 実施スケジュール ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 5

1.7 解析用データ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 6

1.7.1 データの概要 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 6

1.7.2 ヒヤリハット報告 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 6

1.8 調査結果の概要 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 7

2. 調査研究の詳細 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 11

2.1 F:基盤整備 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 11

2.1.1 F1:データ基盤 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・11

2.1.1.1 本調査研究で対象としたデータ ・・・・・・・・・・・・・・・・・・・・・11

2.1.1.2 データ基盤の基本設計 ・・・・・・・・・・・・・・・・・・・・・・・・・ 14

2.1.1.3 データ基盤の構築 ・・・・・・・・・・・・・・・・・・・・・・・・・・・15

2.1.1.4 計器室担当者へのヒアリング ・・・・・・・・・・・・・・・・・・・・・・16

2.1.2 F2:クラウドシステムの構築 ・・・・・・・・・・・・・・・・・・・・・・・17

2.1.3 考察・まとめ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・17

2.2 A1:ヒヤリハット文章の構造化と原因現象の簡易探索 ・・・・・・・・・・・・19

2.2.1 手法 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・19

2.2.2 テキスト構造化技術 ・・・・・・・・・・・・・・・・・・・・・・・・・・・22

2.2.3 ヒヤリハット検索システムの試作 ・・・・・・・・・・・・・・・・・・・・・27

2.2.4 考察・まとめ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・31

2.2.5 課題・提言 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・31

Page 7: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

2.3 A2:ヒヤリハット・理論オントロジーの結合と確率推論による

事故発生の予測 ・・・・・ 34

2.3.1 データの結合と確率推論の概要 ・・・・・・・・・・・・・・・・・・・・・・34

2.3.2 オントロジーによる理論的知識の体系化とその利用 ・・・・・・・・・・・・・35

2.3.3 理論オントロジーとヒヤリハット報告との結合(割り付け) ・・・・・・・・・35

2.3.4 ヒヤリハット報告と TAG 情報を属性とする設備・装置情報の結合 ・・・・・・36

2.3.5 クラスタリングによる分析観点の抽出 ・・・・・・・・・・・・・・・・・・・37

2.3.5.1 クラスタリングの手法の選定 ・・・・・・・・・・・・・・・・・・・・・・37

2.3.5.2 ヒヤリハット報告のクラスタリング ・・・・・・・・・・・・・・・・・・・37

2.3.5.3 アノテーション技術によるノイズ低減 ・・・・・・・・・・・・・・・・・・39

2.3.6 ベイジアンネットワークによる確率推定 ・・・・・・・・・・・・・・・・・・41

2.3.7 確率推論による解析事例と考察 ・・・・・・・・・・・・・・・・・・・・・・42

2.3.8 確率推論の事例(設備別)とモデル事業所による評価 ・・・・・・・・・・・・44

2.3.9 まとめ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・48

2.3.10 ビッグデータ活用の有効性実証の IoT 展開 ・・・・・・・・・・・・・・・・48

2.4 B1:プロセスデータに基づく外れ値検出 ・・・・・・・・・・・・・・・・・・50

2.4.1 概要 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・50

2.4.2 外れ値検出手法 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・50

2.4.2.1 全体概要 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・50

2.4.2.2 マハラノビス距離による外れ値検出 ・・・・・・・・・・・・・・・・・・・52

2.4.2.3 1 クラス SVM による外れ値検出 ・・・・・・・・・・・・・・・・・・・・・54

2.4.3 外れ値検出実験 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・56

2.4.3.1 対象装置、使用したデータ ・・・・・・・・・・・・・・・・・・・・・・・56

2.4.3.2 実験結果 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・57

2.4.3.2.1 相関ペア属性を用いずに 1 クラス SVM を適用した結果 ・・・・・・・・・58

2.4.3.2.2 廃水処理装置に対する適用結果 ・・・・・・・・・・・・・・・・・・・・58

2.4.3.2.3 ベンゼン製造装置に対する適用結果 ・・・・・・・・・・・・・・・・・・60

2.4.3.2.4 常圧蒸留装置に対する適用結果 ・・・・・・・・・・・・・・・・・・・・ 61

2.4.3.2.5 軽油脱硫装置に対する適用結果 ・・・・・・・・・・・・・・・・・・・・63

2.4.3.2.6 実験結果まとめ ・・・・・・・・・・・・・・・・・・・・・・・・・・・64

2.4.3.3 技術スタッフへのヒアリング ・・・・・・・・・・・・・・・・・・・・・・64

2.4.3.3.1 ヒヤリハットデータとの関連 ・・・・・・・・・・・・・・・・・・・・・64

2.4.3.3.2 制御機器の劣化の検知 ・・・・・・・・・・・・・・・・・・・・・・・・65

2.4.3.3.3 温度センサーの劣化の検知 ・・・・・・・・・・・・・・・・・・・・・・66

2.4.3.3.4 外れ値検出結果の計器室担当者への提示について ・・・・・・・・・・・・67

2.4.4 まとめと提言 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・68

Page 8: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

2.4.4.1 まとめ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・68

2.4.4.2 提言 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・68

2.5 B2:プロセスデータ分析による傾向管理や劣化状態予測 ・・・・・・・・・・・70

2.5.1 廃水処理装置のプロセスデータ解析 1

「リフラックスドラム圧力残圧予測」 ・・・・・・・・ 70

2.5.2 廃水処理装置のプロセスデータ解析 2

「ダイレクトスチーム導入減量化検討」 ・・・・・・・ 75

2.5.3 軽油脱硫装置のプロセスデータ解析 1 「硫黄濃度管理」 ・・・・・・・・・・ 80

2.5.4 軽油脱硫装置のプロセスデータ解析 2 「ストレーナー詰まり検知」 ・・・・ 83

2.5.5 アイソシーブ装置のプロセスデータ解析

「制御弁ポジショナーの作動不良検知」 ・・・・・・・ 88

2.5.6 考察・まとめ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・92

2.5.7 課題・提言 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・92

2.6 Ⅱ:ビッグデータの情報処理後の情報共有の有効性の調査研究 ・・・・・・・・93

2.6.1 プラットフォームの試作と展開 ・・・・・・・・・・・・・・・・・・・・・・93

2.6.1.1 プラットフォームの試作結果と考察 ・・・・・・・・・・・・・・・・・・・93

2.6.1.2 プラットフォームの発展と展開 ・・・・・・・・・・・・・・・・・・・・95

2.6.2 インセンティブに関する考察と提言 ・・・・・・・・・・・・・・・・・・・97

2.6.2.1 手法 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・97

2.6.2.2 ステップ1:現状課題整理 ・・・・・・・・・・・・・・・・・・・・・・・98

2.6.2.3 ステップ2:インセンティブ明確化 ・・・・・・・・・・・・・・・・・・・101

2.6.2.4 考察 ・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・ 106

2.6.2.5 課題・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 107

まとめ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・109

Page 9: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

図目次

図 1.4-1 調査研究の実施体制 ・・・・・・・・・・・・・・・・・・・・・・・・・・4

図 1.6-1 実施スケジュール ・・・・・・・・・・・・・・・・・・・・・・・・・・・5

図 1.7-1 ヒヤリハット報告書の例 ・・・・・・・・・・・・・・・・・・・・・・・・6

図 2.1.1-1 ヒヤリハット報告の CSV 構成 ・・・・・・・・・・・・・・・・・・・・14

図 2.1.1-2 プロセスデータの CSV 構成 ・・・・・・・・・・・・・・・・・・・・・14

図 2.2-1 テキスト構造化の例 ・・・・・・・・・・・・・・・・・・・・・・・・・ 22

図 2.2-2 系列ラベリングにおけるラベルの例 ・・・・・・・・・・・・・・・・・・ 23

図 2.2-3 アノテーションツール brat の画面例 ・・・・・・・・・・・・・・・・・・24

図 2.2-4 教師データ量と精度の関係 ・・・・・・・・・・・・・・・・・・・・・・ 26

図 2.2-5 抽出結果の例 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 27

図 2.2-6 ヒヤリハット検索システムの構成 ・・・・・・・・・・・・・・・・・・・ 28

図 2.2-7 ヒヤリハット検索システムの入力画面 ・・・・・・・・・・・・・・・・・ 30

図 2.2-8 検索結果の表示例 ・・・・・・・・・・・・・・・・・・・・・・・・・・ 30

図 2.3-1 データの結合(理論オントロジー・ヒヤリハット・TAG) ・・・・・・・・34

図 2.3-2 トピック解析に基づくクラスタリング ・・・・・・・・・・・・・・・・・ 38

図 2.3-3 クラスタリング結果の例 ・・・・・・・・・・・・・・・・・・・・・・・ 41

図 2.3-4 理論オントロジーと HF による確率推論(TP)・・・・・・・・・・・・・・・42

図 2.3-5 IoT 環境における知的自主防災のコンセプト ・・・・・・・・・・・・・・・49

図 2.4-1 外れ値検出処理のフローチャート ・・・・・・・・・・・・・・・・・・・ 51

図 2.4-2 訓練期間・テスト期間に対する外れ値判定のイメージ ・・・・・・・・・・ 52

図 2.4-3 マハラノビス距離による外れ値検出 ・・・・・・・・・・・・・・・・・・ 52

図 2.4-4 マハラノビス距離による外れ値判定のイメージ ・・・・・・・・・・・・・ 53

図 2.4-5 1 クラス SVM による外れ値検出のイメージ ・・・・・・・・・・・・・・・54

図 2.4-6 1 クラス SVM による外れ値検出 ・・・・・・・・・・・・・・・・・・・・55

図 2.4-7 相関の高い(左)/低い(右)属性ペアの例 ・・・・・・・・・・・・・・ 56

図 2.4-8 相関関係を考慮せずに 1 クラス SVM を適用した結果 ・・・・・・・・・・ 58

図 2.4-9 マハラノビス距離(WWT) ・・・・・・・・・・・・・・・・・・・・・・59

図 2.4-10 高相関ペア属性を用いた 1 クラス SVM(WWT) ・・・・・・・・・・・ 59

図 2.4-11 マハラノビス距離(BZ) ・・・・・・・・・・・・・・・・・・・・・・・60

図 2.4-12 高相関ペア属性を用いた 1 クラス SVM(BZ) ・・・・・・・・・・・・・61

図 2.4-13 マハラノビス距離(TP) ・・・・・・・・・・・・・・・・・・・・・・ 62

図 2.4-14 高相関ペア属性を用いた 1 クラス SVM(TP) ・・・・・・・・・・・・・62

図 2.4-15 マハラノビス距離(L-HT) ・・・・・・・・・・・・・・・・・・・・・ 63

図 2.4-16 高相関ペア属性を用いた 1 クラス SVM(L-HT) ・・・・・・・・・・・・63

Page 10: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

図 2.4-17 制御機器の関連するセンサーデータの動き ・・・・・・・・・・・・・・・66

図 2.4-18 BZ の 2 つの温度センサーの値(上左、上右)

およびそれらの相関性から算出された予測誤差(下) ・・・・・ 67

図 2.5-1 DCS(分散制御システム)図面(WWT の C-3202 塔の周辺) ・・・・・・・70

図 2.5-2 DCS 図面上のプロセスデータ番号 PC32005 ・・・・・・・・・・・・・・・72

図 2.5-3 プロセスデータの傾向変化 ・・・・・・・・・・・・・・・・・・・・・・ 73

図 2.5-4 PC32005PV 残圧発生の一次の近似式 ・・・・・・・・・・・・・・・・・・74

図 2.5-5 PC32005PV 残圧発生の三次の近似式 ・・・・・・・・・・・・・・・・・・74

図 2.5-6 C-3202 塔の周辺の DCS 図面 ・・・・・・・・・・・・・・・・・・・・・ 76

図 2.5-7 2014 年のプロセスデータの推移 1 ・・・・・・・・・・・・・・・・・・・ 76

図 2.5-8 2014 年のプロセスデータの推移 2 ・・・・・・・・・・・・・・・・・・・ 77

図 2.5-9 プロセスデータの推移 ・・・・・・・・・・・・・・・・・・・・・・・・ 78

図 2.5-10 プロセスデータの詳細推移 ・・・・・・・・・・・・・・・・・・・・・・78

図 2.5-11 ステップ応答モデル ・・・・・・・・・・・・・・・・・・・・・・・・・79

図 2.5-12 モデル予測制御 ・・・・・・・・・・・・・・・・・・・・・・・・・・・79

図 2.5-13 L-HT の反応塔とチャージヒーターの周辺の DCS 図面 ・・・・・・・・・・80

図 2.5-14 L-HT 関係のアンケートデータ(一部) ・・・・・・・・・・・・・・・・ 81

図 2.5-15 抽出したプロセスデータと関連プロセスデータと各データの説明 ・・・・・82

図 2.5-16 プロセスデータ(A4501、YI4561L、M4501)の 2014 年の推移 ・・・・・・ 82

図 2.5-17 プロセスデータ(A4501、YI4561L、M4501)の

2014 年 9 月 3 日前後の挙動 ・・・・・・・・ 83

図 2.5-18 L-HT の分留装置 C-4504 と熱交換器 E-4509 の周辺の DCS 図面 ・・・・・ 84

図 2.5-19 E-4509 熱交換器の配管経路上のプロセスデータ ・・・・・・・・・・・・・85

図 2.5-20 P4540PV と T4544PV と PC4507AMV の 2014 年のデータ推移 ・・・・・・86

図 2.5-21 2014 年 2 月 10 日 1 勤の時間帯近辺のプロセスデータの挙動 ・・・・・・・86

図 2.5-22 2014 年 1 月~3 月の P4540PV の実績値とその統計値の推移 ・・・・・・・ 87

図 2.5-23 2014 年の一年間の P4540PV の推移とストレーナー清掃実施日 ・・・・・・87

図 2.5-24 ヒヤリハット発生に関係する DCS 図面 ・・・・・・・・・・・・・・・・ 88

図 2.5-25 ヒヤリハット発生時の FC1311PV と FC1311MV の挙動 ・・・・・・・・・90

図 2.5-26 ヒヤリハット発生時区間前後の KPI(t)の動き ・・・・・・・・・・・・・・ 91

図 2.6-1 プラットフォームの試作 ・・・・・・・・・・・・・・・・・・・・・・ 93

図 2.6-2 プラットフォームの展開イメージ ・・・・・・・・・・・・・・・・・・・ 96

図 2.6-3 因果ループ(CLD: Casual Loop Diagram)例 ・・・・・・・・・・・・・・・ 97

図 2.6-4 現在の保安業務に関わる因果ループ図(CLD) ・・・・・・・・・・・・・・ 99

図 2.6-5 ビッグデータ解析概念図 ・・・・・・・・・・・・・・・・・・・・・・・101

図 2.6-6 ビッグデータ解析による事業者インセンティブ(仮説) ・・・・・・・・・105

Page 11: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

図 2.6-7 ビッグデータ解析基盤導入後の因果ループ図(CLD) ・・・・・・・・・・106

Page 12: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

表目次

表 1.2-1 「コンビナートにおける情報・データの活用を通じた

自主保安の高度化に関する調査研究専門委員会」の開催実績 ・・・・・・1

表 1.2-2 C&RWG の開催実績 ・・・・・・・・・・・・・・・・・・・・・・・・・・2

表 1.7-1 調査研究に用いた解析用データ ・・・・・・・・・・・・・・・・・・・・・6

表 1.8-1 活動の要旨 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・9

表 2.1.1-1 モデル事業所におけるヒヤリハット報告フォーマット ・・・・・・・・・・12

表 2.1.1-2 解析に利用したデータの概要 ・・・・・・・・・・・・・・・・・・・・・13

表 2.1.1-3 アンケートで回答頂く注目する視点の分類 ・・・・・・・・・・・・・・・16

表 2.1.1-4 計器室担当者(Operator)ヒアリングのアンケート結果例 ・・・・・・・ 17

表 2.1.2-1 クラウドシステムの仕様 ・・・・・・・・・・・・・・・・・・・・・・ 17

表 2.2-1 ラベルの種類と個数 ・・・・・・・・・・・・・・・・・・・・・・・・・ 24

表 2.2-2 精度評価結果 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 25

表 2.3-1 化学知識に基づく理論オントロジー(一部) ・・・・・・・・・・・・・・ 35

表 2.3-2 理論オントロジーとヒヤリハット報告との結合 ・・・・・・・・・・・・・ 36

表 2.3-3 ヒヤリハット報告と TAG 情報の結合 ・・・・・・・・・・・・・・・・・・36

表 2.3-4 ヒヤリハット報告の項目(抜粋)とその具体例 ・・・・・・・・・・・・・・・39

表 2.3-5 <問題>クラスタ中のノイズの例 ・・・・・・・・・・・・・・・・・・・・ 40

表 2.3-6 ネガティブ表現数の比較 ・・・・・・・・・・・・・・・・・・・・・・・ 40

表 2.3-7 理論オントロジーと HF による確率推論・・ ・・・・・・・・・・・・・・ 42

表 2.3-8 ダウンストリーム分析の事例(TP) ・・・・・・・・・・・・・・・・・・43

表 2.3-9 アップストリーム分析の事例(TP)(TAG 数:2) ・・・・・・・・・・・43

表 2.3-10 アップストリーム分析の事例(TP)(TAG 数:3) ・・・・・・・・・・・44

表 2.3-11 アップストリーム分析の事例(BZ) ・・・・・・・・・・・・・・・・・ 45

表 2.3-12 アップストリーム分析の事例(PF) ・・・・・・・・・・・・・・・・・ 46

表 2.3-13 アップストリーム分析の事例(N-HT) ・・・・・・・・・・・・・・・・46

表 2.3-14 アップストリーム分析の事例(N-HT) ・・・・・・・・・・・・・・・・47

表 2.4-1 実験に使用した装置 ・・・・・・・・・・・・・・・・・・・・・・・・・ 56

表 2.4-2 データの訓練期間 ・・・・・・・・・・・・・・・・・・・・・・・・・・ 57

表 2.4-3 ペア属性の個数 ・・・・・・・・・・・・・・・・・・・・・・・・・・・ 57

表 2.5-1 解析に用いたデータ ・・・・・・・・・・・・・・・・・・・・・・・・・ 70

表 2.5-2 抽出した事例のヒヤリハットデータ ・・・・・・・・・・・・・・・・・・・ 71

表 2.5-3 抽出したプロセスデータの説明 ・・・・・・・・・・・・・・・・・・・・ 72

表 2.5-4 解析に用いたデータ ・・・・・・・・・・・・・・・・・・・・・・・・・ 75

表 2.5-5 プロセスデータの説明 ・・・・・・・・・・・・・・・・・・・・・・・・ 75

Page 13: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

表 2.5-6 4 種のプロセスデータの FC32050PV との関係と管理基準 ・・・・・・・・・77

表 2.5-7 解析に用いたデータ ・・・・・・・・・・・・・・・・・・・・・・・・・ 81

表 2.5-8 解析に用いたデータ ・・・・・・・・・・・・・・・・・・・・・・・・・ 84

表 2.5-9 抽出したプロセスデータの説明 ・・・・・・・・・・・・・・・・・・・・ 85

表 2.5-10 解析に用いたデータ ・・・・・・・・・・・・・・・・・・・・・・・・・88

表 2.5-11 抽出したプロセスデータの説明 ・・・・・・・・・・・・・・・・・・・・89

表 2.6-1 公開レベルの分類・仕分けの結果、および各技術の公開性評価 ・・・・・・ 94

表 2.6-2 ビッグデータ解析ユースケース(仮説) ・・・・・・・・・・・・・・・・103

Page 14: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

1

1.調査概要

1.1 調査目的

近年のセンサー技術、コンピュータ技術、及び情報処理技術の発展高度化により、これ

まで十分に活用できなかったコンビナート事業所の情報・データを、解析、分析、及び評

価することが可能となった。これにより、コンビナート事業所の自主保安力の拡充拡大の

可能性が高まってきている。

本事業は、コンビナートの事業所内の設備データ、履歴情報、検査データ、操業に関す

るプロセスデータ、テキストデータ(ヒヤリハット報告書)等の情報やデータ(以下、「ビ

ッグデータ」という。)を活用して、事故等の発生の予兆の検出、事故等の発生を未然に防

ぐための技術スタッフに対する気付きや注意喚起、及び事業所内における情報共有等に関

する実証研究を行うことにより、コンビナートの保安における情報技術・各種データ活用

等の有効性を検証し、自主保安の高度化に繋げることを目的とした。ここで、モデル事業

所における技術スタッフとは、製造部に所属して運転管理に携わる所員を指している。

1.2 調査方法

ビッグデータに対するデータサイエンス技術について、鳥取大学と3社の再委託企業が

協力して、モデル事業所が保有するビッグデータを、自然言語処理、各種データサイエン

ス、および知識体系化等を用いて解析・分析する調査研究を実施した。当該調査研究の進

捗状況については、委員会「コンビナートにおける情報・データの活用を通じた自主保安

の高度化に関する調査研究専門委員会」で報告し、助言を得た。以下の表に委員会の開催

実績を示す。

なお、本委員会の活動にあたっては、ご多忙のところ、熱心に取り組んでいただいた既

掲の委員長、および委員の方々、ならびにご協力いただいた関係各位に心からお礼申し上

げます。

表 1.2-1 「コンビナートにおける情報・データの活用を通じた

自主保安の高度化に関する調査研究専門委員会」の開催実績

また、ワーキンググループ(以下、C&RWG)を設置して進捗と方向性について議論を行

い、取りまとめた結果を委員会で報告した。さらに、委員会において検討して定めた情報

管理ルール等に則って当該調査研究を実施するとともに、モデル事業所が保有するビッグ

回 開催日時 議事

第1回 2015/9/14(月) 実施計画と進捗状況の報告と議論

第2回 2015/12/14(月) 調査概要及び進捗状況の報告と議論

第3回 2016/2/19(金) 進捗状況の報告とまとめ・課題の議論

Page 15: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

2

データについては、必要なデータの入手に際して、委員会の事務局を通じてモデル事業所

から入手した。C&RWG 会議の開催実績を以下の表に示す。

表 1.2-2 C&RWG の開催実績

1.3 調査内容

1.3.1 調査内容(仕様)の概要

【Ⅰ】モデル事業所におけるビッグデータ活用の有効性実証

モデル事業所を1箇所定め、当該事業所内で実際に発生した9年間分のビッグデータを、

自然言語処理、各種データサイエンス、および知識体系化等を用いて、事故等の発生の予

兆検出、事故等の発生を未然に防ぐための技術スタッフに対する気付きや注意喚起等の実

証研究を行い、モデル事業所の評価を受ける。

【Ⅱ】ビッグデータの情報処理後の情報共有の有効性の調査研究

【Ⅰ】によって得られた結果を踏まえ、鳥取大学と再委託企業のみが専用に共有するた

めのプラットフォームのプロトタイプを試作し、その有効性と課題を明らかにする。また、

ビッグデータ解析で得られるであろう事業所視点でのインセンティブを検討し、提言を行

う。

1.3.2 【Ⅰ】モデル事業所におけるビッグデータ活用の有効性実証の詳細

(1)調査研究を進めるための基盤整備

F:基盤整備

F1:データ整備

ヒヤリハット報告の内容をエクセルデータに自動変換する。

F2:クラウドシステムの構築

データや知識の秘匿性確保とプラットフォーム構築の基盤となる。

(2)ビッグデータ活用の有効性実証

【Ⅰ】を A(ヒヤリハット報告の分析)系と B(プロセスデータの分析)系に展開する。

A:ヒヤリハット報告の分析および事故発生予測とその提示

回 開催日時 議事

第1回 2015/8/12(水) 実施計画の共有と議論(キックオフ)

第2回 2015/9/8(火) 進捗状況の報告と議論(会議前に見学)

第3回 2015/10/13(火) 進捗状況の報告と議論

第4回 2015/11/17(火) 進捗状況の報告と議論

第5回 2015/12/14(月) 進捗状況の報告と議論

第6回 2016/1/18(月) 進捗状況の報告と議論

第7回 2016/2/19(金) 進捗状況の報告と纏め方議論

第8回 2016/2/29(月) モデル事業所による最終評価

Page 16: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

3

A1:ヒヤリハット文章の構造化と原因現象の簡易探索

ヒヤリハット報告におけるテキスト文の構造化を行い、事故の現象・原因と対策候

補を技術スタッフに提示する簡易検索システムを開発し、事故発生の抑止効果の可能

性を検証する。

A2:ヒヤリハット・理論オントロジーの結合と確率推論による事故発生の予測

ヒヤリハット報告と化学理論の背景(理論オントロジー)、およびプロセスデータ

のセンサーTAG情報の結合データベースを作成し、それらの情報間の関連をベイジア

ンネットワークによってモデル化する。本モデルによって確率推論を行うことによっ

て、技術スタッフに事故に関わる気付きや注意喚起を提示する実験を行い、事故発生

の予測や対策の可能性を検証する。

B:プロセスデータに基づく未知の事故の発生予測とその提示

B1:プロセスデータの外れ値(異常)検知

モデル事業所の操業に関する各種プロセスデータから通常とは異なる状態(外れ値)

を検出し、それを技術スタッフに提示することで、気づきや注意喚起を与えられるか

や事故抑止の可能性があるかを検証する。

B2:プロセスデータ分析による傾向管理や劣化状態予測

設備や制御系の時系列データの解析から、設備や制御系の変化を推定・認識し、変

化点の検出を行う。傾向管理や劣化状態の予測を行い、事故発生の抑止効果の可能性

を検証する。

1.3.3 【Ⅱ】ビッグデータの情報処理後の情報共有の有効性の調査研究の詳細

(Ⅱ1)モデル事業所へのヒアリングにより、情報公開に伴うデメリット、現状の情報共有

により得られる知見と課題について調査する。

(Ⅱ2)【Ⅰ】で構築したクラウド上に、開発情報の秘匿性を確保した、上記に関わるプラ

ットフォームのプロトタイプを試作し、その有効性と課題を明らかにする。

(Ⅱ3)上記で得られた結果を総合し、情報共有の有効性とインセンティブを検討し、提言

を行う。

1.4 調査実施体制

調査実施体制を以下の図に示す。

Page 17: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

4

図 1.4-1 調査研究の実施体制

1.5 調査分担

各チームの主な役割を以下に示す.

(1)鳥取大学研究チーム

【Ⅰ】モデル事業所におけるビッグデータ活用の有効性実証に関して

1) 石油精製理論やヒヤリハット報告から得られる各種の情報・知識を整理・体系化する。

2) 事故の現象と原因候補の関係をビジュアル化し、その関係を定量的に確率推論する。

3) 設備や制御系から得られる時系列データの解析から、設備や制御系の時間的変化を推

定し、変化点の検出を行い、傾向管理や劣化状態の予測の可能性を検証する。

【Ⅱ】ビッグデータの情報処理後の情報共有の有効性の調査研究に関して

1) データの秘匿性を確保するため、クラウドシステムを設計・構築する。

2) 上記で構築したクラウドシステム上にプラットフォームを試作する。「解析モジュール」

において、データマイニング、テキストマイニング、ベイジアンネットなどのデータサ

イエンスソフトを活用して分析を行い、その結果をモデル事業所と連携して、公開可能

レベルに則して分類・仕分けを行う。その結果を踏まえて、プラットフォームの有効性

と課題を検討する。

(2)日立製作所チーム

【Ⅰ】モデル事業所におけるビッグデータ活用の有効性実証に関して

1) 自然言語処理や文章構造化技術によって、ヒヤリハット報告データを分析する。

2) 事故に関わる原因を入力として現象を出力する簡易検索システムを試作して有効性を

検証する。

【Ⅱ】ビッグデータの情報処理後の情報共有の有効性の調査研究に関して

1) モデル事業所のヒアリングを行い、事故情報の公開状況を調査し、隘路事項を分析す

る。

Page 18: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

5

2) 【Ⅰ】のデータサイエンスで得られる情報より、プラットフォームにおいて、その公

開性をより高めるインセンティブ(動機付け)を明確化し、提言を行う。

(3)日本電気チーム

【Ⅰ】モデル事業所におけるビッグデータ活用の有効性実証に関して

1) ヒヤリハット報告データとプロセスデータを連携させ、例外・異常値識別を行う。

2) データの分類を行い、結合データベースの多様化を図る。

(4)横河ソリューションサービスチーム

1) 製造設備の制御を行う DCS(分散制御システム)内の各種プロセスデータの基礎解析

を行い、データの信頼性確保のために基礎解析と整備を行う。

2) ヒヤリハット報告の内容をエクセルデータに自動変換する。

モデル事業所:

保有する高圧ガス、及び高圧ガス設備、並びに高圧ガス保安法に関する知識、ノウハウ、

および知見を活かして、以下の項目を支援する。

1) 現場データの分類と事故やヒヤリハット報告から得られる経験知の集約

2) 事業実施結果の評価と活用案の提示

1.6 実施スケジュール

実施スケジュールを以下に示す。本スケジュールに基づいて、遅滞なく調査研究を実施

した。

図 1.6-1 実施スケジュール

大分類 中分類 小分類 大分類 中分類 小分類

【F】 基盤  F1 ヒヤリハットデータの自動変換 YF2 構成・基本設計 T

【Ⅰ】     仕様①A ヒヤリハット分析・事故予兆

A1 A11 事故防止に繋がった事例の抽出・分類 M

A12 アノテーション付与 HA13 辞書整備・システム化 HNA14 技術スタッフ への提示 全員A15 モデル事業所での評価 M

A2 A21 理論オントロジー T

A22 理論+ヒヤリハット+TAGA23 クラスタリング(LDA) N

A24 ベイジアンネットワークによる予測 TA25 技術スタッフ への提示 全員A26 モデル事業所での評価 M

BB1

B11 マハラノビス・1クラスSVMの適用 NB12 運転員への提示 全員B13 モデル事業所での評価 M

B2B21 時系列解析・モデル予測手法 TYB22 技術スタッフ への提示 全員B23 モデル事業所での評価 M

【Ⅱ】 仕様②

Ⅱ1 事業所へのヒアリング THM

CLD

Ⅱ2 プラットフィオーム試作 セキュリティレベル設定 T

Ⅱ3 情報共有化施策の具現化 H

【Ⅲ】 仕様③経緯と成果のまとめ・提出 全員

Mailstone  M: モデル事業所

Y : 横河ソリューションサービス㈱H : ㈱日立製作所N: 日本電気㈱T: 鳥取大学全員

2月 3月平成27年8月 9月 10月 11月 12月

クラウド構築

データ基盤

平成28年1月

データベース結合

作業ID 作業項目作業内容 担当

ヒヤリハット報告の分類

簡易検索システム

データベース多様化

ヒヤリハットテキスト分析

データ構造化

現状調査

事故予兆

プロセスデータ分析例外(異常)状態を識別

評価1

確率推論評価1評価2

例外・異常識別

評価1評価2

オントロジー構築

評価2

変化点検出

評価2

傾向管理や劣化状態予測

評価1

インセンティブの提言

報告書の作成

因果ループ分析

【Ⅰ】モデル事業所におけるビッグデータ活用の有効性実証(仕様①)

A:ヒヤリハット報告に基づく事故の分析および発生予測とその提示

B:プロセスデータに基づく未知の事故の発生予測とその提示

【Ⅱ】ビックデータの情報処理後の情報共有の有効性の調査研究(仕様②)

【Ⅲ】報告書の作成(仕様③)

MS1

MS2

MS5

MS3

MS4

MS6 MS7

MS1:データ共有化などの基盤機能の確認

MS2:構造化の結果

MS3:例外・異常検知の結果と事故の可能性

MS4:変化点の検出結果と劣化・異常との相関

MS5:オントロジ-/ベイジアンネットによる予測可能性

MS6:プラットフォームの評価

MS7:全体の完成度

Page 19: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

6

1.7 解析用データ

1.7.1 データの概要

委員会の事務局を通じてモデル事業所より提供されたデータの概要を以下の表に示す。

表 1.7-1 調査研究に用いた解析用データ

ここで、TAG(センサー識別指標)は、DCS で計測されるプロセスデータ(圧力、温度、流

量など)に識別を示す。

1.7.2 ヒヤリハット報告

解析に用いたヒヤリハット報告の例を以下の図に示す。基本データとともに、自然文で

書かれた体験内容や離散データ(チェック)で書かれたヒューマンファクタ(HF: Human

Factor)で構成されている。

図 1.7-1 ヒヤリハット報告書の例

データ名 サイズ(GB) 内訳 ファイル形式 ファイル数 備考

プロセスデータ 38.9 Excel 327 TAGデータ、期間2006年1月~2014年12月の9年間分

PDF 103 制御モニター画面

ヒヤリハット(HH)データ 0.4 Excel 3,279 HHカード内容、期間2006年4月~2015年3月の9年間分

計 39.3 3,709

Page 20: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

7

1.8 調査結果の概要

調査研究によって得られた結果の概要を以下に述べる。

Ⅰ:モデル事業所におけるビッグデータ活用の有効性実証

F:基盤整備

本調査研究で解析に必要となるデータ基盤を構築した。主にデータ構造の設計、汎用ソ

フトウェアによりテキストで記述されたヒヤリハット報告書からのデータ抽出、プロセス

データに含まれる冗長データ、異常データなどの除去を行い、設計されたデータ構造への

整形を実施した。このデータ基盤を構築したことにより、本調査研究における解析を可能

とした。汎用ソフトウェアを使用し、ユーザが自由にテキストとして情報を蓄積するだけ

では、データを有効活用するにあたり、変換にかかる手間や完全性などの点から問題があ

ることが明らかになった。報告書などのテキストデータを電子化して蓄積するには、RDB

やGUIを活用したシステムの利用が望ましい。また、データの秘匿性を確保するために、

クラウドシステムを設計・構築した。詳細は2.1節(P.11~)。

A1:ヒヤリハット文章の構造化と原因現象の簡易探索

ヒヤリハット報告の中のテキストを活用する際に課題となる様々なコストを低減するた

めに、テキスト構造化技術について検討した。系列ラベリングによるテキスト構造化技術

を適用し、「故障/不具合」「場所/装置」「対策/修理」という3種類の情報を抽出し

た。テキスト構造化結果を用いたアプリケーションの一例として、ヒヤリハット検索シス

テムを試作した。本システムは、連想検索技術により、簡便な方法で検索が可能であり、

テキスト構造化により、表示するデータ量を低減できる。今後は、抽出・検索精度向上、

現象と原因等の関連付け機能の開発、分野の語彙の体系化等が課題となる。詳細は2.2節

(P.19~)。

A2:ヒヤリハット・理論オントロジーの結合と確率推論による事故発生の予測

石油精製理論に基づくオントロジーを構築し、さらにヒヤリハットデータベースと装置

やデータTAG情報の紐付けによる結合データベースを構築した。本データベースとベイジ

アンネットワークによる確率推論を行い,ヒヤリハットとともにTAG情報や理論と連携し

た解析により,事故の予兆を促す気付きを与えるシステムを開発した。具体的なプロセス

についてアップストリーム分析とダウンストリーム分析を行い、気付き事例を作成し、モ

デル事業所の評価を受けた。この結果、事故等の発生の予測や事故などの発生の未然防止

について、技術スタッフに対する気付きとなりうることを検証した。今後は、リスクオン

トロジーの構築などによる分析情報の多様化とデータ学習に基づく分析データ数増加によ

る推定精度の向上を図る。詳細は2.3節(P.34~)。

Page 21: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

8

B1:プロセスデータの外れ値(異常)検知

プロセスデータから通常とは異なる状態(外れ値)を検出し、計器室担当者に提示する

ことで、注意喚起や事故抑止が可能か検証した。結果、反応装置や測定機器の劣化がセン

サー間の相関性のずれによって発見でき、早期対処できる可能性が示唆された。また、自

動抽出された高相関のセンサーペアと計器室担当者のノウハウとの突合せにより、計器室

担当者の支援や技術伝承にも利用できる可能性が示唆された。今後は、過剰な外れ値検知

を抑制することで、運用時に負担とならない外れ値検知を目指す。また、外れ値とヒヤリ

ハット報告の関連は殆どなく、両者を紐づけた分析は難しいことが判明した。今後、シフ

ト間の申し送り文書等の外れ値と関連が有りそうな文書との紐付けにより、【A2】の分析を

より発展できる可能性が高い。詳細は2.4節(P.50~)。

B2:プロセスデータ分析による傾向管理や劣化状予測

設備や制御系内の時系列のプロセスデータ(2006 年~2014 年の 9 年分)とヒヤリハッ

トデータ(同 9 年分)と計器室担当者へのアンケートデータの解析により、設備状態や製

品状態の変化点の検出を行った。その結果、廃水処理装置で 2 件、軽油脱硫装置で 2

件、アイソシーブ装置で 1 件、合計 5 件の事例について、傾向変化や劣化状態の予測や

検知の可能性を確認した。今後、未着手の装置のデータ解析による予測・検知の可能性

の有る事例を蓄積するとともに、抽出した事例の精度向上と実験による抑止効果の可能

性を検証する必要が有る。将来的には、ヒヤリハット発生日時と符合するプロセスデータ

解析システム(自動化)の開発が望まれる。詳細は 2.5節(P.70~)。

Ⅱ:ビッグデータの情報処理後の情報共有の有効性の調査研究

【Ⅰ】で情報処理された情報やデータを、モデル事業所と鳥取大学、および再委託企業

(3社)の5者のみが専用に共有するためのプラットフォームのプロトタイプを試作し、

情報やデータの秘匿性を確保した上で、開発技術(成果)の公開レベル別に公開性を明示

化することで、その有効性及び課題を調査研究した。また、インセンティブとしては、①

定常運転時の異常早期把握、②想定外発生時の類似事例と危険度の把握、③定量的リスク

分析、④教育レベル向上、などが挙げられる。これを実現するためのビッグデータ解析基

盤の機能としては、(1)各事業者からのデータの収集/蓄積、(2)各事業者単位のデー

タ解析とフィードバック、(3)事業者間での横断的解析実施、(4)解析結果を各事業者

や業界で共有、が挙げられる。詳細は 2.6 節(P.93~)。

活動の要旨をまとめて以下の表に示す。ここで、「結果に対する評価」と「実運用に関す

る見解」については、モデル事業所によるものである。

Page 22: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

表1.8-1活動の要旨

【F】基盤整備

・狙い:本調査研究実施に必要となる、データ基盤を構築する。また、クラウドシステムを構築する。

・期待成果:解析作業実施にあたり、ヒヤリハット報告およびプロセスデータが、即時利用可能な状態になっている。クラウドシステムによって、モデル事業所と鳥取大学、再委託企業のみで情報を共有できる秘匿性の高い環境を確保できる。

1) データ基盤の設計を実施した。2) ヒヤリハット報告書からデータの抽出を実施した。3) 上記抽出結果を整形し、1)で設計したフォーマットへの変換を 実施した。4) プロセスデータから冗長なデータ、解析に不要なデータを 削除した。5) 上記プロセスデータを整形し、1)で設計したフォーマットへの 変換を実施した。6)鳥取大学近郊でクラウドシステムを構築した。

1) 設計にしたがい、調査・解析用データ基盤を構築した。2) 構築したデータ基盤により、本調査研究における解析 が可能となった。3)クラウドシステムの構築によって、プラットフォームの基 盤が整備できた。

ヒヤリハット、及びプロセスデータを、各チームが調査研究する上で、共有できるデータベースを構築、整備し提供することができ、今後も研究を継続するためには必要なものと考える。

専用システムを採用しない限り現状の運用を継続するであろうから、事業所側でも今後検討する上では必要なものと考える。

1) Microsoft社製Word/Excelのような、汎 用ソフトウエアによる、ヒヤリハット報告 書の電子化と保存だけでは、データソー スとして有効活用をするにあたり、デー タの変換などに大きなコストが発生する。2) 紙に代わる単純な電子フォームとする だけでは、入力時の情報の不備、欠損を などを発生する可能性が高い。3) RDB, GUIを活用した、ヒヤリハット報告 書の入力システムの利用が望ましい。

【A1】ヒヤリハット文章の構造化と原因現象の簡易探索

・狙い:ヒヤリハット報告のテキスト部分を構造化することによって、活用コストを低減する。構造化されたヒヤリハット報告を簡易に検索するヒヤリハット検索システムを試作することによって、テキスト構造化の価値を実証する。

・期待成果:従来活用されていなかったテキスト部分の情報を利用可能とすることで、ヒヤリハット報告の活用価値を向上する。

1) ヒヤリハットから抽出すべき情報を検討し、「故障・不具合」 「場所・装置」「対策・修理」に関わる情報を抽出するものとした。2) 上記に関する正解データを作成した。3) 系列ラベリング技術による情報抽出プログラムの作成と結果の 評価を実施した。4) 構造化されたヒヤリハット報告を簡易に検索できるヒヤリハット 検索システムを、連想検索エンジンを用いて試作し、モデル事業 所により評価頂いた。

1) 系列ラベリング技術により、ヒヤリハットテキストから、 重要情報として、「故障・不具合」「場所・装置」「対策・ 修理」を抽出可能であることを確認した。2) 連想検索エンジンにより、ヒヤリハット報告中の「故障・ 不具合」「場所・装置」等を効率的に検索できることを 確認した。

検索システムについては、場所・不具合・対策として過去のH・H事例が生かされており、非常に興味を引く内容であった。また、今後への課題も浮き彫りとなり、より精度の高いものになる可能性と有効利用について認識できた。

経験の浅い運転員に対して、語弊があるかもしれないが遊び感覚で検索を実施し、装置そのものに興味を覚える等への運用が模索できる。

1) テキスト構造化:抽出精度向上。ユース ケース、性能要件明確化。2) ヒヤリハット検索システム:ランキング方 式の分野適応、抽出情報の関連付け。3) 「故障・不具合」等の体系的用語辞書の 構築。

【A2】ヒヤリハット報告(HH)とプロセスデータに基づく事故の分析および発生予測

・狙い:事故の発生との関連を予測(確率推論)して、運転者に気付きや注意喚起を提示する験を行い、事故発生の抑止効果の可能性を検証する。

・期待成果:石油理論/HH/設備・装置/データTAGの結合情報より、HHでは明記されていない事故発生に関わる気付きを与える。テーマⅡ(事業所向けインセンティブ)向けに、HHデータの蓄積の意義とその利用効果の認識を得る。

1)製油精製理論に基づくオントロジーを構築し、HHデータベース との紐付けを行った。2)上記データベースと装置やデータTAG情報の紐付けによる 結合データベースを構築した。3)上記データベースによりベイジアンネットワークによる確率推論 を実施4)上記によるアップストリーム分析とダウンストリーム分析を行い、 気付き事例を作成した。5)上記システムと気付き事例についてモデル事業所による評価を 受けた。

結合データベースとベイジアンネットワークによる確率推論を行い,HHのみでは得られない、TAG情報と理論と連携した新たな知識を導出した。

石油精製理論からの構築であり運転員への教育への展開や、本来の目的である事故防止の観点より、各種作業に対する危険認識への応用が期待できる。

一部データについては、起こりえるであろう危険性を読み取ることが出来たが、理論オントロジーより導く同種データ量の積み重ねや関連TAG情報の精度向上が求められる。

1)解析が2014年度データに留まった。 データベースの拡張による推論精度の 向上。2)各HHの要因がヒトor装置など、更なる 情報の結合による推論範囲の拡張。3)データTAGの変動や【B1】・【B2】の オンライン活用や複数エージェント による事故予測や対策策定支援 によるIoT展開を提言する。

【B1】プロセスデータの外れ値(異常)検知

・狙い:運転データ(プロセスデータ)中の通常と異なる状態(外れ値)を自動検出し運転員に提示することで、事故発生の気付きや注意喚起を与えうるか検証する。また、検出された外れ値とヒヤリハット報告(HH)を連動させた分析の可能性を探る。

・期待成果:プロセスデータの外れ値検知結果が運転員にとって新たな事故発生に関わる気付きになり得ることを示す。また、検出された外れ値とHHの関連性を明らかにする。

1) モデル事業所へのヒヤリングを通じ、外れ値検知に関してノイズ となるセンサを除外した。2) 従来法として、マハラビノス距離に基づく手法を適用した。3) 提案手法として、センサ間の相関に基づく外れ値検知の手法を 適用した。4) 従来法と提案手法の検知結果を比較し、提案手法の優位性を 評価した。5) 提案手法に基づく外れ値検知結果について、モデル事業所に よる有用性の評価を受けた。6) 自動構築されるセンサ間の相関自体の利用可能性について、 モデル事業所にヒヤリングした。7) HHと同時期の外れ値検知結果を紐付けし、関連性をモデル 事業所に確認した。

1) 本モデル事業所のデータでは、提案手法がより頑健に 外れ値検知できることを確認した。2) 反応装置や測定機器の劣化を早期検知できる可能性 を示した。3) 高相関のセンサペアと、運転員のノウハウを照合する ことで、運転員の支援・教育目的に利用できる可能性を 示した。4) 外れ値検知結果とHHの関連性は殆どなく、両者を連動 させた分析が難しいことを確認した。

センサ間の相関については今後の若手運転員への他センサーへの展開に於ける支援としての可能性が期待できる。一方、外れ検知に関しては通常運転時か、意図した作業における外れかの識別に課題が残った。

非常に興味ある内容であるが、現状運用する段階ではないと判断する。今回の活動で課題が浮き彫りとなり、今後の取組みに寄与出来ると考える。

1) 検出された外れ値の多くはマニュアルモ ードにおける人手操作を過剰に検出して おり、マニュアルモードと自動運転モード の区別による検出精度向上の可能性有。2) 検出された外れ値の一部は、モデル事 業所内部の詳細なテキスト(シフト間の 申し送り事項等)との対応が取れること が判った。更なる文書と外れ値検出の 結果の分析とともに、検出された外れ 値に対応するTAGをもとに【A2】の確率 推論(アップストリーム分析)を行い、 事故の可能性を予測することで、事故 予知に関わる教育支援となるものと 考える。

【B2】プロセスデータ分析による傾向管理や劣化状態予測

・狙い:設備や制御系内の時系列データの解析から、設備や制御系の時間変化を推定し、変化点の検出を行い、通常運転状態のデータとの比較などにより、傾向管理や劣化状態の予測を行い、事故発生の抑止効果を検証する。

・期待成果:事故発生前に、運転者に状態変化に関する気付きを与えて、注意喚起し、事故発生を抑止する。

1) 廃水処理装置の塔清掃時のHHデータとプロセスデータの 解析2) 廃水処理装置の塔清掃前のダイレクトスチーム導入量に 関連するプロセスデータの解析3) 軽油脱硫装置の硫黄濃度に関連するアンケートデータとプロセ スデータの解析4) 軽油脱硫装置のHHデータとストレーナー詰まりに関連するプロ セスデータの解析5) アイソシーブ装置の制御弁の作動不良に関連するプロセス データの解析6) 解析に使用したデータ量 :12.9GB (プロセスデータ 116ファ イル、DCS図面 86枚、HHデータ 3,297件、アンケートデータ 1,627件)

1) 廃水処理装置の圧力監視と関数近似による残圧 発生予測の可能性を確認した。2) 廃水処理装置の流体温度を監視し、蒸気量を制御 するモデル予測の可能性を確認した。3) 軽油脱硫装置の硫黄濃度と水素導入量の監視による 脱硫状態の変化検知の可能性を確認した。4) 軽油脱硫装置のストレーナー詰まりを上流圧力の標準 偏差値の監視による検知の可能性を確認した。5) アイソシーブ装置の制御弁の作動不良を制御弁の 流量と操作量の相関係数の監視による検知の可能性 を確認した。

既知情報であり、新たな認識は無かったが、操作要領への記載や装置不具合の管理面で利用できる情報が一部あった。

限られた情報について反映の可能性はあるが、個々の解析であり今後データ量が増えてくれば、共通のトラブルについては有効利用できる可能性があるかもしれない。

1) 未着手の装置のデータ解析による設備 劣化や事故発生の予測・検知の可能性 の有る事例の蓄積。2) 抽出した予測・検知の可能性の有る 事例の精度向上と実験による抑止効果 の可能性の検証。3) HH発生日時と符合するプロセスデータ 解析システム(自動化)の開発。

・狙い:モデル事業所における、現状の情報共有のあり方、および、課題について調査する。プラットフォームのプロトタイプを試作し、その有効性を検討するとともに、事業所視点でのインセンティブの明確化を行う。

・期待成果事業者間での情報共有およびプラットフォームのあり方について今後の指針を得る。

1)保安業務に関わる、ステークホルダ(事業者)の内部KPIやプロ セスを見える化し、現在の課題に関して整理した。2) プラットフォームのプロトタイプを試作し、【Ⅰ】で得られた結果 を仕分けして、その公開性を評価した。3)事業所目線での情報公開に関わるインセンティブを明確化した。

1) 事業者側としては、想定外事象やヒヤリハットの蓄積 により、技術スタッフ、計器室担当者、設備運転員の 「熟練度」を上げることが課題であることが分かった。2) プラットフォームにおけるビッグデータ解析基盤の機能 として、①事業者からの運用データの収集/蓄積、 ②データ解析および解析結果の事業者へのフィード バック、③各事業者の解析結果を集約して事業者間 での横断的解析実施、④解析結果の蓄積、および 各事業者、業界団体などとの共有、を導出。3) 事業者側のインセンティブとして、①定常運転時の異常 早期把握、②想定外発生時の類似事例把握および危険 度把握、③リスクアセスメント時における理論と過去事例 に基づく定量的リスク分析、④過去事例や背景情報の体 系化による教育レベル向上、を導出。

3-1) ビッグデータ解析基盤の機能実現①理論オントロジ-ヒヤリハット-DCSデー タ(TAG)間の「紐付け」手法の確立②紐付け手法の一般化およびビッグデータ への対応③紐付けされたデータの解析手法確立④事故予測や対策立案の知的支援とIoT 展開3-2) ビッグデータ解析基盤の要件実現(A)各事業者のデータ保護(B)多様な解析サービサの参加(C)事業者保有データのフィルタリング /意味づけ(D)各事業者における解析結果の匿名化

結果 結果に対する評価 実運用に関する見解 今後の課題・提言

【Ⅱ】ビックデータの情報処理後の情報共有の有効性の調査研究

テーマ名

【Ⅰ】モデル事業所におけるビッグデータ活用の有効性実証

テーマの狙い・期待成果 実施したこと

kushida
タイプライターテキスト
9
Page 23: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

10

調査研究結果の概要は、以下のとおりである。

本調査研究では、【Ⅰ】モデル事業所におけるビッグデータ活用の有効性実証については、

モデル事業所のビッグデータの分析により、事故等の発生の予兆検出、事故等の発生を未

然に防ぐための技術スタッフに対する気付きや注意喚起等の実証研究を行い、コンビナー

トの保安における活用の有効性を検証した。具体的には、以下の通りである。

・ヒヤリハット文章の構造化と原因現象の簡易探索技術(A1)は、モデル事業所より「有

効性有り」との評価を受け、実用化による技術スタッフへの注意喚起や教育効果が期待

される。

・ヒヤリハット・理論オントロジーの結合と確率推論による事故発生の予測(A2)は、モ

デル事業所より「有効性有り」との評価を受け、技術スタッフへの予兆検出やその気付

きが期待される。

・また、プロセスデータの外れ値(異常)検知(B1)とプロセスデータ分析による傾向管

理や劣化状予測(B2)は、モデル事業所より、プロセス変動やリスクのリアルタイム把

握が、「ある程度期待される」との評価を得た。

これにより、コンビナート(モデル事業所)の保安におけるビッグデータ活用の有効性

を検証できた。

また、【Ⅱ】ビッグデータの情報処理後の情報共有の有効性の調査研究では、【Ⅰ】によ

って得られた結果を踏まえ、モデル事業所以外の大学等の研究機関、コンビナート制御機

器メーカ、IT企業等の4者程度の者のみが専用に共有するためのプラットフォームのプ

ロトタイプを試作し、開発結果の仕分によって情報の公開性を評価する事で、プラットフ

ォームの有効性と課題を明らかにした。また、情報の公開性を高めるための事業所目線で

のインセンティブについて検討し、提言を行った。

評価の詳細は,次章の各節、および表 2.6-1(P.94)に示す。

Page 24: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

11

2. 調査研究の詳細

2.1 F:基盤整備

2.1.1 F1:データ基盤

本節においては、ヒヤリハット報告、及びプロセスデータの解析を行うためのデータ基盤の構

築に関する報告を行う。まず、本調査研究で対象とするデータの概要を述べ、データ基盤の設計

方針、そして、データ基盤構築作業の概要を述べる。また、調査研究を円滑に進めるために実施

した計器室担当者へのヒアリングについての概要を述べる。最後に、今回のデータ基盤構築を踏

まえ、今後、この様なデータを活用していくにあたっての課題と提言を述べる。

2.1.1.1 本調査研究で対象としたデータ

本調査研究においては、石油精製における代表的設備である常圧蒸留装置および高圧ガスを扱

い安全管理が特に重要なナフサ以下の軽質分の処理装置を中心に、以下のデータを収集し、調査

研究を実施した。

・ヒヤリハット報告

・プロセスデータ

まず、それぞれのデータの概要について述べる。

ヒヤリハット報告

ヒヤリハットは、重大な事故には至らなかったが、場合によっては事故につながっていたかも

しれない事象に対する現場要員の気づきを意味し、操業現場では、リスクマネージメントの観点

から、その報告が奨励されているものである。報告の失念を防ぐため、プラントの計器室担当者

に対して定期的な報告を義務付ける事業者も少なくなく、モデル事業所においても同様である。

報告内容については、事業者ごとに異なるが、例えば、一般財団法人 石油エネルギー技

術センターは、http://www.pecj.or.jp/japanese/safer/knowledge/doc/no-32.doc において、

その項目を例示している。モデル事業所においては、表 2.1.1-1 に示す項目をヒヤリハット

報告として義務付け、収集を行っている。

Page 25: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

12

表 2.1.1-1 モデル事業所におけるヒヤリハット報告フォーマット

プロセスデータ

プロセスデータとは、本報告においては、操業において利用され、かつ連続的に収集されるデ

ータ全般を指す。具体的には、センサーの測定値やバルブなどの操作端への制御指令値、機器・

制御系の動作状態を示すデジタル値などがこれに該当する。

これらの実際のデータは、DCS(Distributed Control System, 分散制御システム)や多変数

制御を行う高度制御システムなどから得られるデータであるが、PIMS(Plant Information

Management System, 操業情報管理システム)に集約を行うのが一般的である。PIMS は、論理

的にはデータを行方向がタイムスタンプ、列方向がタグ(変数)からなるテーブルとして、デー

タを蓄積する。モデル事業所においても PIMS が利用されており、本調査研究ではプロセスデ

ータとして PIMS に蓄積されたデータを利用した。なお、モデル事業所においては PIMS のデ

ータは 1 分周期で蓄積されているが、全データを扱うとデータ容量が膨大となるため、本調査

Page 26: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

13

研究では PIMS のデータを 10 分周期で利用することとした。

上記のヒヤリハット報告、およびプロセスデータのデータソース、フォーマット等を表 2.1.1-2

にまとめる。

表 2.1.1-2 解析に利用したデータの概要

ヒヤリハット報告 プロセスデータ

データソース ヒヤリハット報告書 PIMS

フォーマット モデル事業所規定の報告フォーマ

ット。Microsoft 社 Word、または

Excel 形式

PIMSから Microsoft社 Excel形式

にてエクスポート。サンプリング間

隔は 10 分

期間 2006 年 4 月

~2015 年 3 月

2006 年 1 月

~2014 年 12 月

サンプル数 約 3,300 件 約 470,000 サンプル

タグ(変数)

の数

- 約 6,000 タグ

Page 27: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

14

2.1.1.2 データ基盤の基本設計

本調査研究では、複数の解析をそれぞれ異なる環境で実施するため、汎用性の高い CSV ファ

イルとしてデータ基盤を構成することとした。ヒヤリハット報告とプロセスデータについて、個

別に解析する場合を想定し、それぞれを図 2.1.1-1, 図 2.1.1-2 に示すようなフォーマットとして

個別に構成することとした。

図 2.1.1-1 ヒヤリハット報告の CSV 構成

図 2.1.1-2 プロセスデータの CSV 構成

なお、ヒヤリハット報告にある事象の発生時刻は、報告者の担当直番号(8時間の勤務時間帯)

として報告されるため、それぞれ直の勤務時間の始点と終点として発生時刻を構成することとし

た。

Page 28: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

15

2.1.1.3 データ基盤の構築

実際にデータ基盤を構築するにあたって、実施した主な作業は以下である。

・ヒヤリハット報告内容の抽出と整形

・プロセスデータの整形と異常データのマスキング

それぞれの作業の概要を述べる。

ヒヤリハット報告内容の抽出と整形

モデル事業所で作成されているヒヤリハット報告書は、Microsoft 社 Excel、または Word 形

式であるため、そのまま汎用の解析環境においてデータとして扱うことが難しい。そのため、ま

ず、ヒヤリハット報告書の項目の分析と、VBA 等のスクリプト言語を利用し、各項目の抽出を

行った。

抽出時には、以下の前処理を行った。

・ 自由記述の項目については、スペース、改行の除去等の最低限の前処理を行った。

・ チェックボックス選択形式の項目については、解析における利便性を考慮し、選択の有無

を{1,0}に数値化した。

・ 直として与えられているヒヤリハット報告の発生時区間を、モデル事業所の各直の勤務時

間帯を参考に、実時間へと変換した。

・ 項目に記述がない、あるいは選択されていない場合は、その全てを欠損値とした。

・ 報告書内においては、画像を参照し、詳細に図解しているものも見られたが、今回の解析

においては画像を利用しないこととした。

このようにして抽出されたヒヤリハット報告を、図 2.1.1-1 の形式の CSV ファイルとして整

形した。

プロセスデータの整形と異常データのマスキング

モデル事業所から受領した PIMS のデータは、Microsoft 社 Excel 形式、かつタグごとにタイ

ムスタンプを持つ冗長なデータであったため、整形を行い、図 2.1.1-2 に示した CSV 形式への

変換を行った。また、データは、PIMS が設定する様々な異常ステータスを示す文字列を含んで

いた(例: システムが停止中のため、タグが当該時点において未生成など)が、今回の解析に

おいては、これらの異常ステータスを利用しないこととし、全て文字列 NaN(Not a Number)

値への変換を行った。

Page 29: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

16

2.1.1.4 計器室担当者へのヒアリング

本調査研究においては、調査研究を円滑に進めるため、調査対象となる装置に関わる計器室担

当者に対して、アンケート調査を実施した。アンケート内容は、

・計器室担当者が当該装置の運転において、特に注目しているプロセスデータは何か?

・なぜ、上記のプロセスデータを注目しているのか?

・注目している上記のプロセスデータを見る際に、同時に見る他のプロセスデータはあるか?

の3点であり、それぞれ上位3つまでを装置ごとに回答頂くこととした。また、計器室担当者が

注目する視点として、生産計画・品質管理/安全管理などの目的の差異や、注目のタイムスコー

プが短期/長期の差異があることを想定し、表 2.1.1-3 に示す A, B, C, D の視点の分類ごとに回

答を頂くこととした。

表 2.1.1-3 アンケートで回答頂く注目する視点の分類

生産計画・品質管理面 安全管理面

短期

(担当直内~

1週間)

A B

長期

(一週間以上) C D

本アンケートを38人の計器室担当者に対して実施し、計1600件の回答を得た。結果につ

いては、表 2.1.1-4 に例示するような形でまとめた。なお、本アンケート調査結果は、本調査研

究において直接的な解析対象となるものではないが、ヒヤリハット報告、およびプロセスデー

タを説明するためのメタデータとして、解析対象の絞り込みや、解析結果の検証に利用した。

Page 30: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

17

表 2.1.1-4 計器室担当者(Operator)ヒアリングのアンケート結果例

計器室担当

ID

対象

装置

経験

年数

視点

分類

注目

データ

関連

データ 注目する理由

Operator1 装置 A 4 A 1

(省略)

閉塞懸念

Operator1 装置 A 4 A 2 閉塞懸念

Operator1 装置 B 4 A 1 硫黄分管理

Operator1 装置 C 4 A 1 後工程へのフィード性状変化

Operator1 装置 D 4 A 1 触媒移送出来ているか

Operator1 装置 D 4 A 2 装置の変動監視

Operator1 装置 E 4 A 1 収益ロス防止 ・・・

2.1.2 F2:クラウドシステムの構築

情報の秘匿性が確保されているクラウドシステムを構築した。その概略仕様を以下の図

に示す。

表 2.1.2-1 クラウドシステムの仕様

2.1.3 考察・まとめ

本項においては、ヒヤリハット報告、及びプロセスデータの解析を行うためのデータ基盤構築

に関する報告を行った。報告において、本調査研究で対象とするデータの概要を述べ、データ基

盤の設計方針、そして、データ基盤構築作業の概要をまとめた。また、調査研究を円滑に進める

ために実施した計器室担当者へのヒアリングについての概要をまとめた。

最後に、今回のデータ基盤構築を踏まえ、今後、この様なデータを活用していくにあたっての

課題と提言を述べる。

今回の調査研究でデータ基盤を構築するにあたって、特に課題となったのは、ヒヤリハット報

告のデータ化である。この点に関して、直面した課題として、以下が挙げられる。

・ データの完全性: 必須項目が入力されていない、表記に揺れがある、フォーマット指定

中継サーバOS:WindowsCPU:2コアメモリ:4GB

ディスク容量:500GB ディスク容量:100GB

ビッグデータサーバOS:WindowsCPU:4コアメモリ:8GB

Page 31: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

18

外の方法による記述などにより、ヒヤリハット報告内の情報がデータサンプルとして利用

できないケースが散見された。

・ 報告書からデータへの変換: 報告書テンプレートの改訂、あるいは報告者による変更に

より、同一変換プログラムによる一括処理が出来なかった。結果として、複数パターンの

変換プログラムが必要となり、データへの変換に過大なコストを要した。

これらの直接的な要因としては、Microsoft 社 Word/Excel などの汎用ソフトウェアがヒヤリ

ハット報告に利用されていることが挙げられる。これらのソフトウェアで提供されているマクロ

機能などを利用し、データの完全性のチェックやデータ変換を行うことは不可能ではないが、一

般的な利用者にとってのハードルは低くはない。これは、必ずしも、モデル事業所だけの問題で

なく、報告書に上記の汎用ソフトウェアを利用しているケースは少なくないと考えられる。

この様な問題を避けるためには、報告書の入力を GUI 経由で行い、入力項目のチェックを行

っていくとともに、RDB に構造的、かつ逐次的に報告書をデータとして蓄積していくなどの対

応が望ましい。結果として、リアルタイムで得られるプロセスデータと、計器室担当者などのプ

ラント操業に関わる人に属していた情報が連携し、より広範な活用が期待できる。

Page 32: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

19

2.2 A1:ヒヤリハット文章の構造化と原因現象の簡易探索

2.2.1 手法

(1)背景と目的

現在、産業保安の水準維持・向上を図りながら、IoT (Internet of Things)、ビッグデータ、

人工知能等の新技術を導入することにより、産業保安を高度化していくという潮流が生ま

れている。特にセンサーの高度化、低価格化によるリアルタイムモニタリング精緻化への

期待が大きい。

その一方で、従来からリスクマネージメントのために蓄積されているヒヤリハットデー

タを活用することは、非常に重要と考えられている。ヒヤリハットには、様々な人間の知

見や判断が含まれており、これらを知識化して活用することで、センサーによって得られ

る情報を補完することが期待できる。2.2 節では、ヒヤリハット分析の高度化、効率化につ

いて検討した結果について述べる。

(2)ヒヤリハット活用における課題

(a)ヒヤリハットによる安全対策

ヒヤリハットとは、「重大な災害や事故には至らなかったが、事故になってもおかしくな

かった事例」であり、様々な分野においてリスクマネージメントのために使用されている

用語である。ハインリッヒの法則では、重大事故1件に対して、軽微な事故が29件、ヒ

ヤリハットが300件発生していると言われている。ヒヤリハットを撲滅することによっ

て、重大事故を間接的に防ぐことができるという考え方から、ヒヤリハットの重要性が認

知されている。

ヒヤリハットは、主に、ヒヤリハット事例の共有という形で活用されていることが多い。

例えば、厚生労働省の「職場のあんぜんサイト」では、様々な業種で発生し易い、典型的

なヒヤリハット事例集を公開している[2.2-1]。また、国土交通省は、航空安全情報自発報告

制度(VOICES)を開始し、公益財団法人航空輸送技術研究センター(ATEC)が運営を行っ

ている[2.2-2]。経済産業省は、独立行政法人製品評価技術基盤機構(nite)と協力し、事故

情報収集制度として、製品事故情報の収集を行っている[2.2-3]。また、公開はされていない

が、各事業者が社内でヒヤリハットの収集や共有を行っている例は多いと思われる。

(b)ヒヤリハット活用における課題

ヒヤリハットに関する取り組みは広く行われているが、課題も多い。ヒヤリハット調査

のデメリットとしては、以下が挙げられている[2.2-4]。

(ⅰ)件数が多いため、調査担当者の処理能力を超える。

(ⅱ)報告システムと調査方法がない。

(ⅲ)調査結果が膨大かつ些細となり、的確な利用ができない。

(ⅳ)本人が自分の不利となる失敗(ミス、ヒューマンエラー)を申告する必要がある。

Page 33: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

20

(ⅰ)、(ⅱ)、(ⅲ)を解消するために、事故情報の公開とデータベースの構築が必要で

あり、収集した情報を適切に加工する必要があると指摘されている。(ⅱ)はヒヤリハット

収集のコスト、(ⅰ)はヒヤリハット分析のコストであり、(ⅲ)はヒヤリハット利用のコ

ストの問題である。

一方、ヒヤリハットの効果については、通信工事作業におけるヒヤリハットの分析が行

われている[2.2-5]。ヒヤリハットの効果に対するアンケートを実施し、「効果あり」が 63

名(93%)、「効果なし」が 1 名(1.4%)、無回答が 4 名(5.6%)であったと報告している。また、

上記に関連して、効果の有無の判断理由を尋ねたところ、効果がある理由が 53 件、効果が

ない理由が 19 件、得られた。効果がない理由としては、「マンネリ化」、「意識の違い」、「情

報の共有化の不足」などが挙げられている。全体としては、効果があるという回答が多い

が、効果がある理由については、「事前対策」、「危険認識」、「危険予測」が挙げられており、

注意喚起に役立つという、間接的な効果があると捉えられている。

以上を整理すると、以下が課題であると考えられる。

(a)コスト

現場の負担が小さく、専任の分析者等が不要であれば、無理なく続けていくことが可能

となる。活用コストの低減が大きな課題となる。

(ⅰ)作成・収集コスト

ヒヤリハットの作成は設備運転員が行うものであり、本来業務が極めて多忙であるため、

それ以外の業務に時間を割く余裕がないことが多い。また、質が高いヒヤリハット報告

を作成しようとすると、更に時間が必要となる。

(ⅱ)分析コスト

収集されたヒヤリハットはデータベース等に蓄積され、公開・共有されていることが多

い。しかしながら、蓄積されたヒヤリハットを分析し、有用な知識を抽出するためには

多大なコストが必要である。一方、分析されていないヒヤリハットをそのまま共有して

も、利用コストが高いため、活用は進まない。

(ⅲ)利用コスト

ヒヤリハットは多くの場合、玉石混交であり、価値のあるヒヤリハットを見つけるには

多くの手間が掛かる。適切に分析が行われ、整理されていない場合には役に立つヒヤリ

ハット情報を入手するためのコストが大きくなり、現場の負担が増加する。また、通常、

ヒヤリハットは前提や背景知識、詳細な状況説明等を含むため、1件のヒヤリハットを

読んで理解するためには時間が掛かる。

(b)効果

効果の定量化が難しい。間接的に効果があることは認知されているが、効果が定量的に

示されていない。また、納得感、実感に乏しい。

Page 34: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

21

(3)本研究での手法

以上の課題を解決するために、本研究では以下の手法でアプローチする。

化学工場では、元々、重大事故の発生頻度は非常に低い。そのため、あるヒヤリハット

を未然に防いだことが、重大事故の防止につながったかどうかの検証が困難である。頻度

が低い事象に関し、効果を定量的に計測することは本質的に難しい問題である。そのため、

本研究では、効果を増加させるアプローチについては次年度以降の課題とし、活用コスト

を低減するための手法について主に検討を行うものとした。

(a)作成・収集コスト

作成に関しては、適切な過去の事例を参照することで、執筆支援を行う方式が考えられ

る。また、テンプレート化も有効である。収集に関しては、作成時にOfficeソフト

等を用いるのではなく、Web化等により、入力するとただちに登録されるような構成と

することが望ましい。2.1 節における議論も参照されたい。

(b)分析コスト

収集されたヒヤリハットデータの分析を可能な限り自動化、定型化することで分析コス

トを低減する。RDB のような構造化されたデータであれば、様々な分析手法を用いること

で、分析を(半)自動化することが可能である。また、分析のための様々な定石が知られ

ており、試行錯誤を繰り返す必要は少ない。一方、テキストのような非構造データの場合

には、まず、テキストを構造化することが必要となる。形態素解析技術によってテキスト

を単語に分割し、頻度を集計するという様な単純な方法は、現在でも広く使われているが、

テキスト情報には多くの曖昧性が含まれることから、単純な単語抽出だけでは問題が多い。

例えば、「詰まり」のような語句が出現していたとしても、「詰まりを防ぐことが重要」、「詰

まりではないことが判明」のような文脈では、発生した不具合現象として「詰まり」を抽

出することは適切ではない。このため、自然言語処理により、テキスト解析を高度化する

ことが必要である。

(c)利用コスト

情報を発見、入手するためのコストに対しては、簡便な検索・推薦機能を実現すること

で、コストを低減することが可能である。従来のヒヤリハットデータベースでは、全文検

索のような標準的な検索機能を用いたプル型の情報入手手段のみが提供されている。本研

究では、自然文検索のような簡便な検索機能、更に情報推薦のようなプッシュ型の情報入

手手段を提供することでコストを低減する。

理解・読解のためのコストに対しては、要約や抄録のように、ヒヤリハットの重要箇所

のみを抜粋し、読解すべきデータ量を低減することでコストを低減する。

Page 35: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

22

以上をまとめると、本研究での手法は下記のようになる。

テキスト解析技術を用いたヒヤリハットの活用コスト低減

・分析コスト : 自然言語処理技術によるテキスト構造化による分析容易化

・情報入手コスト : 簡便な検索・情報推薦技術の利用による情報入手容易化

・理解・読解コスト: テキスト構造化(重要箇所抽出)による読解データ量低減

2.2.2 テキスト構造化技術

(1)テキスト構造化とは

構造データにも様々なものがあるが、本研究では代表的なデータとして、RDB で使用さ

れる表形式のデータを考える。表形式のデータは、様々な属性の列からなっており、各行

は、各列の属性の属性値の集合である。属性としては、その表を表現するために必要な種

類の情報が選択される。本研究では、このような属性と属性値の組をテキストから抽出す

ることをテキスト構造化と呼ぶ。例を図 2.2-1 に示す。左側は入力のテキストであり、構造

化されていない。このとき、テキストから抽出すべき情報(属性)として、発生した「不

具合」、不具合の「原因」、不具合が発生した「場所」、不具合に対する「対策」を抽出する

ことを想定する。そして、「流量が出ない」という語句が「不具合」属性、「P-253B」が「場

所」属性、「ストレーナーの詰まり」が「原因」属性、「ストレーナーを清掃」という語句

が「対策」属性に対応することを解析し、タグを付与する。このように、本研究では、抽

出したい情報の種類(属性)に対し、その属性値に相当する語句をテキストから抽出する

ことをテキスト構造化と呼ぶ。

図 2.2-1 テキスト構造化の例

(2)適用技術

テキスト中のある特定の種類の語句を抽出する技術は情報抽出技術と呼ばれている。特

定の種類の語句とは、代表的なものとして、人名、組織名、地名等の固有表現が挙げられ、

固有表現が対象の場合には、固有表現抽出と呼ばれる。情報抽出技術は、現在、系列ラベ

リングとして定式化され、教師あり学習の問題として解く方法が主流となっている。系列

ラベリングとは、観測された系列に対し、ラベルの系列を付与する技術である。観測され

た系列に対し、条件付き確率が最大となるラベルの系列を解として抽出する。抽出したい

語句は、複数の単語からなる場合があるため、BIO 法等の方法でラベルを設計する。BIO

2006/9/23 2勤P-253Bの流量が出ない。ストレーナーの詰まりを疑い、ストレーナーを清掃したら流量が安定した。

<場所>P-253B</場所>の<不具合>流量が出ない</不具合>。<原因>ストレーナーの詰まり</原因>を疑い、 <対策>ストレーナーを清掃したら</対策>流量が安定した。

Page 36: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

23

法は、抽出したい語句の先頭の単語を B、抽出したい語句の先頭以外の単語を I、抽出した

い語句以外の単語に O を付与する方法である。抽出したい語句が一単語である場合には、

B を付与する。図 2.2-2 に例を示す。図 2.2-2 の例の場合、テキストから「国会議事堂」と

う場所を示す固有表現を抽出することを想定している。テキストが、トークン(例の場合

は単語)に分割されており、各トークンに対してラベルが付与される。「国会議事堂」以外

の単語には O が付与される。「国会議事堂」の先頭の単語「国会」には B が付与され、そ

れ以外の単語「議事」、「堂」には I が付与される。このようにラベルを設計することで、抽

出したい語句を、範囲を含めて表現することができる。

図 2.2-2 系列ラベリングにおけるラベルの例

ラベルの決定は、例えば、CRF (Conditional Random Field)と呼ばれるモデルを用いて

行われる。BIO 法によってラベルが付与されたテキストを教師データとしてモデルを学習

し、学習されたモデルを用いて、未知のテキストにラベルを付与することができる。

当初は、固有表現の抽出が中心であったが、教師あり学習による方式が普及したことで、

様々な種類の情報の抽出に適用されている。例えば、特許の中の「効果」と「手段」の抽

出[2.2-6]、医療テキスト中の「病名」、「症状」の抽出[2.2-7]、Web 文書からの顔文字の抽

出[2.2-8]、レシピからの「食材」、「道具」等の抽出[2.2-9]などに関する研究がある。系列ラ

ベリングの詳細については、例えば、[2.2-10]を参照されたい。

本研究では、標準的な情報抽出技術として、CRF による情報抽出技術を適用し、ヒヤリ

ハットデータの中の不具合に関連する情報の抽出を試みる。

(3)教師データの作成

(a)ラベルの決定

テキスト中から抽出すべき情報を検討し、以下のラベルを設定した。

・故障/不具合: ネガティブな現象や症状を示す表現

・場所/装置 : 場所、装置名、部品等を示す表現

・対策/修理 : 実施された対策や修理の内容を示す表現

原因については、以下の理由からラベルには採用しなかった。原因と結果は、ある「故

障/不具合」そのものが持つ性質ではなく、2つの「故障/不具合」間の関係を示してい

・・・ 昨日 国会 議事 堂 前 には ・・・O B I I O O

Page 37: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

24

る。すなわち、「故障/不具合」を原因として、別の「故障/不具合」が発生するという関

係にある。そのため、「故障/不具合」が連鎖的に発生する場合には、ある「故障/不具合」

は原因にも結果にもなり得ることから、語句に付与するラベルとしては適切でないと考え

られる。

(b)ヒヤリハットへのラベルの付与

モデル事業所よりご提供頂いた約 3,300 件のヒヤリハットから、時期が古い 1,000 件を

抽出し、人手によってラベルを付与した。アノテーションのためのツールとしては、OSS

である brat を使用した[2.2-11]。brat の画面の例を図 2.2-3 に示す。

図 2.2-3 アノテーションツール bratの画面例

brat では、GUI を介して、マウス等によってテキストにラベルを付与できる。ラベルを

付与したい範囲のテキストをマウスで選択し、付与したいラベルの種類を選択すると、結

果がアノテーションファイルに格納され、図 2.2-3 に示すようにアノテーション結果が表示

される。図 2.2-3 の例では、例えば、「P-4501」が「場所/装置」(LOCATION)であるとい

うラベルが付与されている。ラベルの範囲は、波括弧で表現され、ラベルの種類が波括弧

上に表示される。付与したラベルの種類と個数は、表 2.2-1 に示す通りである。

表 2.2-1 ラベルの種類と個数

種類 個数 個数/件

FAULT (故障/不具合) 13,645 4.1

LOCATION (場所/装置) 9,926 3.0

REPAIR (対策/修理) 2,747 0.8

(3)評価

(a)評価方法

Page 38: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

25

1000 件のアノテーション済みヒヤリハットデータから、時期が古い 900 件を教師データ

として CRF のモデルを学習した。CRF で用いる特徴量としては、単語の表層文字列および

品詞に加え、テストデータのみに出現している単語の意味を類推するためにクラスタリン

グによる特徴量を追加している[2.2-12]。

残りの 100 件をテストデータとして、学習したモデルを適用し、ラベルを付与した。付

与されたラベルを人手付与したラベルと比較し、精度を計測した。教師データ作成作業に

おいて、ラベルの範囲には個人差が大きいことが判明したため、評価において、人手付与

したラベルと境界が完全に一致していなくても、正解のラベルの範囲を半分以上含んでい

る場合には、正解として扱うこととした。

(b)評価結果

評価結果を表 2.2-2 に示す。

表 2.2-2 精度評価結果

種別 適合率[%] 再現率[%] F 値 [%]

LOCATION 90.2 81.9 85.8

FAULT 67.1 51.4 58.2

REPAIR 72.0 46.9 56.9

適合率は、ノイズの少なさを示す指標であり、プログラムが付与したラベルの中で正し

いラベルの割合を示す。再現率は、漏れの少なさを示す指標であり、人手で付与した真に

正しいラベルの中でプログラムが正しいラベルとして出力できたものの割合を示す。F 値は、

適合率と再現率の調和平均であり、F 値=(2×適合率×再現率)/(適合率+再現率)で計算される。

再現率と適合率はトレードオフの関係にある、すなわち、漏れを減らそうとするとノイズ

が増え、ノイズを減らそうとすると漏れが増えるという関係にあるため、両者を総合的に

判断するために F 値が用いられる。

結果を見ると、「場所/装置」は精度良く抽出出来ている。一方、「故障/不具合」、「対

策/修理」は、精度が若干低い。特に、再現率が約 50%程度であり、半数程度が抜け落ち

ている。

図 2.2.-4 は、教師データ 900 件からランダムに 100 件ずつデータを除去し、教師データ

量を小さくした場合の精度変化を示している。

Page 39: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

26

図 2.2-4 教師データ量と精度の関係

結果を見ると、適合率は教師データの文書数に対する影響が小さく、再現率は影響が大

きい。

抽出誤りの例を図 2.2-5 に示す。図 2.2-5 の例の場合、以下が誤っている。

・「停止中」が故障/不具合(FAULT)として誤って抽出されている。

「停止」自体はネガティブな事象ではないが、想定外の停止や他の故障/不具合に伴っ

て停止したりすることがあるために、故障/不具合と判断されたと考えられる。停止とい

う動作が発生したのか、停止しているという状態にあるのかを区別する必要があり、「中」

が重要な手掛かりとなる。

・「正常な指示を示さない」が故障/不具合(FAULT)として抽出されず、抜け落ちている。

「ない」を正しく認識できていないため、抽出の抜け落ちが発生したと考えられる。

従来の系列ラベリングによる情報抽出は、主に名詞・名詞句を抽出対象としていた。一

方、本研究で抽出対象とした事象のうち、「故障/不具合」、「対策/修理」は、動詞句、な

いしは動作性のある名詞句として表現されていることが多い。そのため、「中」や「ない」

のような機能語の認識が重要となっていると考えられる。

0.0%

10.0%

20.0%

30.0%

40.0%

50.0%

60.0%

70.0%

80.0%

90.0%

100.0%

100 200 300 400 500 600 700 800 900

精度[

%]

教師データ数[文書]

LOCATION適合率

LOCATION再現率

FAULT適合率

FAULT再現率

REPAIR適合率

REPAIR再現率

Page 40: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

27

図 2.2-5 抽出結果の例

なお、「正常な指示を示さない」には、「のでは」が後続しており、実際に起きた事象で

はなく、懸念を示していることが分かる。本研究では、このような実際に起きていない事

象に対しても、故障/不具合を付与するという方針で評価を行った。これは、「計器の指示

が正常でない⇒針が変形している」という知識は価値が高いためである。ヒヤリハットに

は、このような、実際には起きていない事象に関する専門家の知見が多く含まれているた

め、解析する価値があると考える。

(4)考察と今後の課題

「場所/装置」は、名詞が中心で抽出が比較的容易であるのに対し、「故障/不具合」、「対

策/修理」は、動詞句で記述されており、表現のバリエーションが非常に大きかった。そ

のため、「場所/装置」は、精度が高く、「故障/不具合」、「対策/修理」は、精度が低い

という結果になったと思われる。再現率が低いこと、教師データ量を増やすにつれて、再

現率の精度が向上していることから、表現のバリエーションに対して、教師データ量が不

足していると考えられる。

精度向上のために、最も単純な方法は、教師データ量を増やすことである。学習タスク

の精度は教師データ量の対数に比例すると言われており、今回のデータを外挿すると、約

5,000 件程度で、「故障/不具合」が F 値で約 75%、「対策/修理」が約 85%となると推定

できる。教師データを作成するコストが大きいため、半教師あり学習等を用いることで、

作成コストを低減することが必要となる。

2.2.3 ヒヤリハット検索システムの試作

(1)試作の狙い

テキスト構造化技術によって、様々な分析を行うことが容易となるが、具体的にどのよ

うに応用すれば良いか、一例を示すことで、テキスト構造化結果の有効性を示す。本研究

では、アプリケーションの一例として、テキスト構造化結果を簡易な方法で検索・推薦す

ることが可能なヒヤリハット検索システムを試作する。

本システムは、以下の特徴を持つ。

自然文入力のような簡易な方法で、ヒヤリハットを検索することができる。

Page 41: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

28

入力された不具合と関連する情報を提示することで、不具合の原因となる不具合現象、

対策/修理方法の候補発見を支援することができる。

検索結果の全文ではなく、重要部分のみを表示することで、読解・理解が容易である。

(2)システム構成

ヒヤリハット検索システムのシステム構成を図 2.2-6 に示す。検索インデックス作成処理

では、まず、ヒヤリハットデータが、テキスト構造化エンジンによって処理され、テキス

ト構造化結果が出力される。テキスト構造化結果は、連想検索エンジンに入力され、検索

用インデックスが作成される。今回は、連想検索エンジンとして、汎用連想計算エンジン

(GETA)のアルゴリズムを独自に実装したエンジンを用いた[2.2-13]。GETAは、情

報処理振興事業協会(IPA)が実施した「独創的情報技術育成事業」の研究成果である。

検索処理では、例えば、現在発生している不具合を自然文として入力すると、類似した

不具合を検索し、その不具合と関連する不具合(原因の候補)や対策を結果として出力す

る。入力された自然文は、まず、形態素解析され、重み付きの単語の集合に変換される。

単語の集合を連想検索エンジンに入力することで、類似した不具合のリストが検索結果と

して出力される。

図 2.2-6 ヒヤリハット検索システムの構成

(3)連想検索エンジン

連想検索は、ベクトル空間モデルと呼ばれるモデルにしたがって、検索を行う類似文書

検索技術の一つである。ベクトル空間モデルでは、BoW (Bag-of-Words)モデルと呼ばれる

表現方法を用いて文書を表現する。例えば、「文書の検索で BoW を使用する」という様な

文に対しては、この文から、「文書」、「検索」、「BoW」、「使用する」という単語が抽出され

る。「の」のような助詞は通常無視する。このとき、単語の出現順序を無視し、抽出した単

語を次元とする単語の出現頻度の分布からなるベクトル<1,1,1,1>を考え、これ

が文の意味を表現しているとする。「BoW が文書を検索する際に使用される」という文であ

っても、単語の出現順序が無視されるため、同じベクトルが得られる。検索は、ベクトル

ヒヤリハットデータ

不具合 原因 対策

連想検索エンジン

テキスト構造化結果

現在発生している不具合を入力

類似した不具合とその原因や対策を提示

テキスト構造化エンジン

Page 42: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

29

間の類似度が大きい、あるいは距離が小さい文書を意味が似た文書と考えることによって

実行される。類似度としては、ユークリッド距離やコサイン測度等が用いられる。

単純にテキスト中の出現頻度によって文書をモデル化するだけでは、検索精度が不十分

である。そのため、ベクトルの重みに関して工夫が行われる。代表的な方法に、tf-idf 法と

呼ばれる方法がある。tf は、term frequency の略であり、ある単語のテキスト中の出現頻

度を示す。idf は、inversed document frequency の略であり、ある単語が出現したテキス

トの件数の逆数である。テキスト中で重要性が高い単語は、数多く使われることが知られ

ており、tf は単語のテキスト中での重要性を示している。一方、一般的な単語であるか、特

殊な単語であるかを区別するための指標が idf である。一般的な単語はよく使用されるため

頻度が高くなり易く、特殊な単語は頻度が小さくなり易い。そのため、tf が小さくても、特

殊な単語はテキスト中での重要度が高い。一般的な単語は、多くの文書に使用される可能

性が高いため、多くの文書に含まれる可能性が高い。そのため、単語の出現文書数を用い

て、単語の一般性を判断することができる。tf-idf 法では、tf と idf を組み合わせることに

よって、単語の重みを決定する。

(4)データ構造

テキスト構造化結果は、以下のように連想検索エンジンに入力する。テキスト構造化に

よって、テキストから3種類の語句が抽出される。このとき、同一テキストから抽出され

た3種類の語句に対し、<故障/不具合-場所/装置-対策/修理>という3つ組を生成

する。3つ組の1項目目の「故障/不具合」のみを、連想検索エンジンに登録してインデ

ックス化する。検索によって、どの3つ組がヒットしたか特定されると、対応する3つ組

の情報を表示する。これにより、入力された「故障/不具合」に対し、関連する「故障/

不具合」、「場所/装置」、「対策/修理」を表示することができる。

(5)試作結果

(a)画面の例

ヒヤリハット検索システムの入力画面を図 2.2-7 に示す。調べたい「故障/不具合」に関

する文をテキストエリアに入力し、「送信する」ボタンを押下することで、図 2.2-8 に示す

ような検索結果が得られる。検索結果は、入力に類似した「類似故障・不具合」欄、「場所・

装置」欄、「類似故障・不具合」と同じヒヤリハットに含まれていた「関連不具合」欄、「対

策・修理」欄に整理されて表示される。このようにテキストが構造化されていることによ

り、情報抽出のためのコストを低減することができる。

Page 43: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

30

図 2.2-7 ヒヤリハット検索システムの入力画面

図 2.2-8 検索結果の表示例

(b)構造化の効果

表示されるデータ量は、「故障/不具合」、「場所/位置」、「対策/修理」のみに絞ってい

るため、大幅に低減されている。ヒヤリハットのテキスト部分のデータ量が、約 7.3M バイ

トであるのに対し、アノテーションされたテキストのデータ量は約 3.0M バイトであり、半

分以下となっている。そのため、読解に掛かるコストが低減されている。

Page 44: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

31

2.2.4 考察・まとめ

テキスト構造化技術によるヒヤリハット分析について検討した。

ヒヤリハット活用における課題として、特に活用におけるコストの低減を実現するため

に、テキスト構造化技術を活用するという手法を検討した。

テキスト構造化技術による精度評価においては、「場所/位置」に関しては、F 値で 85.8%

と、ほぼ十分な精度が得られたが、表現のバリエーションが大きい「故障/不具合」、「対

策/修理」については、それぞれ、58.2%、56.9%と精度向上が必要なことが分かった。

また、テキスト構造化技術を用いた分析のアプリケーションの一例として、ヒヤリハッ

ト検索システムを試作した。ヒヤリハット検索システムは、連想検索技術を用いることで、

簡易に検索を行うことができ、構造化されたヒヤリハットのテキストを用いることによっ

て、読解に必要なデータ量を低減することができる。モデル事業所からは、現状の精度で

も、作業前のミーティングでの発生しそうな事象の事前確認等で活用できそうであるとの

コメントを頂いた。一方、故障/不具合発生時の原因診断のような用途では、精度も含め

て利用は難しいとのご意見であった。

また、このようなシステムによって、提出したヒヤリハットが活用されていることを見

える化できると、ヒヤリハットを提出するモティベーションを高めることになる。マンネ

リ、陳腐化を避けるという意味でも有用であると考えている。

2.2.5 課題・提言

今後の課題・提言について述べる。

(1)テキスト構造化

テキスト構造化に関しては、精度向上の必要性がある。最も単純な方法は教師データ量

を増やすことであるが、大きなコストが掛かる。別のアプローチとしては、CRF のような

標準的な技術ではなく、最近進展が著しい Deep Learning 等の最新技術を適用することが

考えられる。ただし、Deep Learning は、比較的計算量が大きいという問題点がある。い

ずれの方法にせよ、精度向上のためのコストが、精度向上によるメリットと見合うかが課

題となる。アプリケーションや業務によって必要とされる精度は異なる。例えば、注意喚

起等の目的であれば、精度は現状程度でも問題ない。むしろ、ランダム性を導入すること

により、同じヒヤリハットを繰り返し表示しない等の工夫が重要である。モデル事業所と

ユースケースを具体化し、性能要件の明確化を進める必要がある。

また、他事業所への展開を進めるにあたり、事業所毎にヒヤリハットの文体が異なり、

精度が低下する可能性がある。

(2)ヒヤリハット検索システム

本研究では、一般的な BoW モデルを用いる検索エンジンを使用したが、文書間の類似度

については、より業務知識を反映したモデルがあり得る。類似度のドメイン適用に関して

は、” Learning to Rank”技術を利用できる。”Learning to Rank”はその名の通り、検索に

Page 45: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

32

おけるランキングを学習する技術であり、ランキング結果を教師データとして与えること

で、適切なランキング関数を学習できる。このような技術により、プラント保全分野に特

化した検索システムを開発することが必要である。

また、結果の提示に関しても改良の余地がある。ある不具合と関連する不具合、場所/

装置、対策/修理との関係は、同じテキストに含まれているかどうかによって判定してい

た。しかしながら、あるテキスト中には複数の不具合、場所/装置、対策/修理情報が含

まれているため、表示が冗長な場合がある。表示データ量を縮減するためには、故障/不

具合、場所/装置、対策/修理間の関係を特定し、直接関係がある情報のみを出力するこ

とが必要となる。含意認識や因果関係抽出のような、語句間の関係を認識する技術を強化

する必要がある。

(3)その他の応用に向けて

その他の応用として、ベイジアンネットワークを含む、データマイニング(定量的な分

析技術)への適用がある。データマイニングでは、構造データを対象に分析を行うが、テ

キスト解析による構造化によって、テキストのような非構造データを対象とすることがで

きるようになる。ただし、ベイジアンネットのような高度な分析を行うためには、データ

の名寄せが問題となる。データ量と比較して、変数(ベイジアンネットの場合はノード)

の数が多い場合には、データスパースネスのため、正しい学習が行えないためである。そ

のため、表記は異なっても意味は同じ、あるいは類似している語句を統一することが必要

となる。名寄せのためには、同義語・類義語の抽出技術や LDA 等の次元圧縮技術を使うこ

とができるが、自動で名寄せを行うと、専門家には分かりにくい可能性がある。

ヘルスケア分野では、ICD-10 (International Classification of Diseases)のような体系化

された用語辞書の整備が進んでおり、分析が容易となっている[2.2-14]。例えば、ICD-10

では、「胸部食道癌」のような用語に対し、下記のような体系が与えられている。

C00-D48 新生物

C15-C26 消化器の悪性新生物

C15 食道の悪性新生物

C15.1 食道の悪性新生物,胸部食道

胸部下部食道癌 C151

胸部上部食道癌 C151

胸部食道癌 C151

胸部中部食道癌 C151

このように、分類が体系化されていることで、任意の詳細さで分析を行うことができる。

例えば、データ量が多い場合には、「C151 胸部食道癌」と「C150 頚部食道癌」を区別し

て分析を行い、データ量が少ない場合には、両者を区別せずに、「C15 食道の悪性新生物」

Page 46: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

33

として処理するという様な対応が可能となる。

保守分野においても、このような体系化された辞書、シソーラスやオントロジーを構築

することによって、分析が容易になると考えられる。

[参考文献]

[2.2-1] http://anzeninfo.mhlw.go.jp/

[2.2-2] http://www.jihatsu.jp/

[2.2-3] http://www.nite.go.jp/jiko/

[2.2-4] 小林英男, 安全と技術社会の繁栄を担うリスクマネージメント, 日本金属学会会報

まてりあ, Vol.42 No.10pp. 713-716, 2003.

[2.2-5] 椎名和仁, 通信工事作業員が体験するヒヤリ・ハットの傾向分析と事故防止教育効

果の検証-建設現場におけるヒヤリ・ハットの取り組み- , 労働科学, Vol.88, No.44,

pp.121-129, 2012.

[2.2-6] Yusuke Sato, Makoto Iwayama, Experiments for NTCIR-8 Technical Trend Map

Creation Subtask at Hitachi, NTCIR-8, 2010.

[2.2-7] Osamu Imaichi, Toshihiko Yanase, Yoshiki Niwa, HCRL at NTCIR-10 MedNLP

Task. NTCIR 2013.

[2.2-8] 渡邉謙一, 高橋寛幸, 但馬康宏, 菊井玄一郎, 系列ラベリングによる顔文字の自動

抽出と顔文字辞書の構築, 言語処理学会第 19 回年次大会発表論文集, pp.866-869, 2013.

[2.2-9] 笹田鉄郎, 森信介, 河原達也, 山肩洋子, 部分的アノテーションコーパスから学習

可能な固有表現認識器, 言語処理学会第 21 回年次大会発表論文集, pp.748-751, 2015.

[2.2-10] 浅原 正幸, 自然言語処理と系列ラベリング技術 , オペレーションズ・リサー

チ,Vol.52, No.11, pp.689-694, 2007.

[2.2-11] http://brat.nlplab.org/

[2.2-12] Osamu Imaichi, Toshihiko Yanase and Yoshiki Niwa, HCRL at NTCIR-10

MedNLP Task, pp.713-714, 2013.

[2.2-13] 安田知弘, 今一修, 岩山真, 丹羽芳樹, 連想検索エンジンのスケーラビリティおよ

び障害耐性の向上, 情報処理学会第 69 回全国大会, pp.383-384, 2007.

[2.2-14] http://www.dis.h.u-tokyo.ac.jp/byomei/icd10/

Page 47: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

34

2.3 A2:ヒヤリハット・理論オントロジーの結合と確率推論による事故発生の予測

2.3.1 データの結合と確率推論の概要

ヒヤリハット報告書のうち、ヒューマンファクタ(HF: Human Factor)と石油精製に関

わる化学知識で構成する理論オントロジー、および設備や装置の分類とそれらに関連する

TAG(各種センサーの認識番号)情報を結合したデータベースを作成した。データの結合

とそれに基づく確率推論の概要を以下の図に示す。ただし、今年度の計画では、プロセス

データとの結合は設定していない。

図 2.3-1 データの結合(理論オントロジー・ヒヤリハット・TAG)(HH:ヒヤリハット)

石油精製プロセスの事故に関する客観的な理論的知識(理論オントロジー)、報告書に基

づく設備運転員の主観的経験知(ヒヤリハット報告)、および TAG 情報を属性とする設備・

装置情報を構成要素としたベイジアンネットワークにより確率推論を行う。これにより、

各知識の観点からヒヤリハットの発生原因を確率的に推定する原因推定システムを試作し

た。本システムにより、TAG 情報を属性とする特定の設備について、ヒヤリハットの理論

的背景とそれに関わるヒューマンファクタ(HF: Human Factor)との関係を推定できる。

ここで、HF とは設備運転員の経験不足や知識不足などの技術的要因や、疲労や睡眠不足

などの身体的要因を含む。そこで、ヒヤリハット報告を中心とて、広く理論的背景や製造

プロセスの情報を考慮した事故の予想や対策の気付きを当てることが期待される。

Page 48: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

35

2.3.2 オントロジーによる理論的知識の体系化とその利用

オントロジー[2.3-1] とは、対象世界を形造っている概念と概念との関係を体系的にまと

めて記述する。「概念」は対象世界を説明するための必要条件であり、各ノードでそれを表

現する。ノード間の関係は「 is-a 関係」、「part-of 関係」、および「attribute-of 関係」で

結合される。また、同等の階層を「兄弟関係」、また上下階層を「親子関係」と言う。

本調査研究で作成した理論オントロジーの一部を以下の表に示す。

表 2.3-1 化学知識に基づく理論オントロジー(一部)

本オントロジーでは、ヒヤリハット報告の原因が理論的知識として抽象-具体の関係を表

す「is-a 関係」に基づき、上位層から順に階層的に体系化されている。例えば、製造現場

で発生する不具合の原因はプロセス異常、火災的危険、有害物危険、装置異常、機械的危

険、プラント外、および安全設備・手順異常のいずれかに分類される。その中でもプロセ

ス異常のさらなる原因は、化学組成、熱移動、および物質移動のいずれかに分類される。

また、熱移動のさらなる原因は、温度過大、温度過小のいずれかに分類される。さらに、

温度過大の原因は、気温上昇、加熱過大、除熱過小、物質量過小、および熱交換過小のい

ずれかに分類され、事故に関わる表現となる。

2.3.3 理論オントロジーとヒヤリハット報告との結合(割り付け)

本オントロジーの上位層から順に、「理論的一次原因」、「理論的二次原因」、「理論的三次

原因」、「理論的四次原因」、「理論的五次原因」、および「理論的六次原因」とする。各ヒヤ

リハット報告に対して、理論的原因を割り付ける。これらの割り付けには、ヒヤリハット

報告中のキーワードを用いる。割付けの例を以下の表に示す。

1 一次原因 2 二次原因 3 三次原因 4 四次原因 5 五次原因 6 六次原因100000 プロセス異常 110000 化学組成 111000 原料組成変化 111100 アルカン分率過大

111200 アルケン分率過大111300 1環芳香族分率過大111400 2環以上芳香族分率過大111500 分子量過大111600 分子量過小111700 含硫黄化合物濃度過大

112000 化学平衡 112100 平衡定数過大 112110 温度過大 112111 気温上昇112112 加熱過大112113 除熱過小112114 物質量過小112115 熱交換過小

112120 温度過小 112121 気温低下112122 加熱過小112123 除熱過大112124 物質量過大112125 熱交換過小

112200 平衡定数過小 112210 温度過大 112211 気温上昇112212 加熱過大112213 除熱過小112214 物質量過小112215 熱交換過小

112220 温度過小 112221 気温低下112222 加熱過小112223 除熱過大112224 物質量過大112225 熱交換過小

112300 平衡右シフト 112310 全圧過大 112311 供給量過大112312 下流詰まり

112320 全圧過小 112321 供給量過小112322 上流詰まり112323 漏洩

112330 原料分圧過大 112331 原料供給量過大112332 副原料供給量過小

112340 副原料分圧過大 112341 副原料供給量過大112342 原料供給量過小

112400 平衡左シフト 112410 全圧過大 112411 供給量過大112412 下流詰まり

112420 全圧過小 112421 供給量過小112422 上流詰まり112423 漏洩

112430 原料分圧過小 112431 原料供給量過小112432 副原料供給量過大

112440 副原料分圧過小 112441 副原料供給量過小112442 原料供給量過大

113000 化学反応速度 113100 目的反応速度過大 113110 温度過大 113111 気温上昇113112 加熱過大

・・・・・・・・・・・・・・・・・・・・・・・・中略・・・・・・・・・・・・・・・・・・・・・・・・・・

13

Page 49: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

36

表 2.3-2 理論オントロジーとヒヤリハット報告との結合(HH:ヒヤリハット)

2.3.4 ヒヤリハット報告と TAG 情報を属性とする設備・装置情報の結合

各ヒヤリハット報告に関連する設備や装置とそれに属するTAGを連携させてデータを結

合した。結合データベースの一部を以下の表に示す。なお、結合に際して、ヒヤリハット

報告のうち、プロセス異常やヒューマンエラーに関わらないケースについては、70%程度

のスクリーニングを行っている。

表 2.3-3 ヒヤリハット報告と TAG 情報の結合(HH:ヒヤリハット)

1 2 3 4 5 6 1 2 3

1 6 0 0 0 0 0 側溝の上蓋 踏み外し怪我をする2 1 1 2 2 1 3 冷却能力が落ちて 第1冷凍機が止まってしまう3 1 1 2 2 1 3 冷却能力が落ちて 第1冷凍機が止まってしまう4 5 0 0 0 0 0 はずれた蓋 足がつまずいて 転倒5 5 0 0 0 0 0 片足が入るくらいの穴 夜間 気付かず転倒してしまう6 6 0 0 0 0 0 ヘルメットの高さ 頭突き7 1 1 2 3 2 3 ずっとブローしてあった8 1 1 2 1 1 2 ST 弁 閉止出来ない9 1 1 2 2 2 2 エマルジョンブレーカー ドラムを間違って入れ10 3 2 0 0 0 0 詰まりがいきなり取れた 体に浴びる オイルが出てこなかった11 1 1 2 4 4 1 軸受けよりシャリシャリ音 グリスアップ12 2 3 0 0 0 0 ラインが回収ピット内 手が滑り 瓶を落として13 1 1 3 2 3 1 採取した旨の記載が全く無かった LOが劣化

60 6 0 0 0 0 0 自転車 左側通行61 6 0 0 0 0 0 車 ぶつからず62 4 4 0 0 0 0 銘板 読み取れない63 2 3 0 0 0 0 サンプル 弁にぶつかって 拍子にコック弁が開いて64 1 1 2 4 3 1 注入量低下65 2 3 0 0 0 0 脱水運転用でC-4602に接続されている オイル抜き66 4 1 2 0 0 0 LGが汚れ D67 5 0 0 0 0 0 よろけて 思わずノズルを手放して落として 下に人がいたら68 5 0 0 0 0 0 むき出し はみ出し 火傷69 5 0 0 0 0 0 雪が落ちてきた70 1 3 8 0 0 0 ダストパージ 差圧が通常より低 A単独通気のはずがA.Bパラ通気71 1 1 3 2 5 1 触媒サンプル 廃触媒が混入72 5 0 0 0 0 0 目の前に大きなハンドル 階段 通路側へはみ出し73 7 0 0 0 0 0 エレベーター 止まったまま74 4 3 0 0 0 0 画面上のボタン75 5 0 0 0 0 0 通路が狭く 足をぶつける76 1 1 2 4 3 1 前日値50kL/hで当日60kL/h HS原油切替とHSBTM変更 タンクNo.もR/D量も同じと錯覚77 1 1 2 3 3 1 目標値の入力をしようとした所変更前の値が87.37 96.98で入力 目標値設定でCV10が動く78 1 1 2 3 3 1 妙に低い値が設定 同設定値が上がって79 4 2 1 0 0 0 PGを外してみるとやはり不良

・・・・・・・・・・・・・・・ 中略 ・・・・・・・・・・・・・・・

HH No.理論オントロジー候補 分類キーワード

発生要因:人的要因 装置要因* プロセス状態変化有無 装置番号 環境分類 温度 流体 バルブの場合 関連TAG類人ミス 仕組NG潜在リスク 装置劣化* 人が処置変化by人Pro変化 装置番号 高圧(>1MPa)高温(>300℃)中温(100-300℃)低温(<-20℃)プロセス流体副原料気体副原料液体水蒸気水 排水 潤滑油のみ常時開 定常的に開閉サンプリング時開緊急時開常時閉 圧力 P 温度 T 流量 F 液面 L 計算他 M

1 * 1 1 P-23-702 1 1 1 P23728,PC23705T23752,T23757FC23707LC23703,LC237202 1 * 1 1

FAP-2P-43-506,

1 1 F4633

3 1 * 1 1 E-43-304 1 14 1 * 1 1 D-4519 1 FS4518A,FS4518B5 * 1 1 D-2401 1 1 PC2401 T2404 F2404 LC2402,LC24206 * 1 1 R-43-201 1 1 PC43211TC432027 * 1 1 D-43-309A/B 1 1 1 一応装置番号記載しましたが、ラインセットミスの事例で内容物等による直接の影響はありませんPD43329T433208 * 1 1 P-3901,D-3901 1 1 T39619 * 1 1 P-8438B 1 1 FS43155,FC4310210 * 1 1 D-504 1 1 TC518 F507 LC505,LC50611 1 * 1 1 X/Y装置のサンプルは多数あるためH・Hの記載では判断できませんでした。12 1 * 1 1 C-4605 1 1 1 T4673 F4635,F4633,F4634LC4612,L4623,LC431313 1 * 1 1 D-502 1 1 1 1 PC502 T513 FC512 LC50314 1 * 1 1 K-4502A1 1 1 P4521 T4535 F4569,F453415 1 * 1 1 FC3922,F-3901 1 1 T3940 FC392216 1 * 1 1 P-7266B 1 PD2210 FSC227017 1 * 1 1 P-7266B 1 PD2210 FSC227018 1 * 1 1 D-23-705 1 1 1 PC23709TC23805FC23726LC23708RAW,LC23708,LC23708A19 1 * 1 1 D-43-252 1 1 LC4300320 1 * 1 1 P-2206C 1 1 1 当該ポンプがトリップするかも?の事例で装置変動は起こりえますが、内容物の影響はありません。取り合えづ装置番号は入れましたが・・・T2247 FC2231 LC221521 * 1 1 P-2219E 1 1 1 F226622 1 * 1 1 加熱炉のダンパー取扱いに関する運用面での事例なので、装置番号は未記入です。23 * 1 1 P-3205A 1 1 F3200624 1 * 1 1 P-2205 1 1 1 T2246 FC2228,FC226925 1 * 1 1 K-43-202A 1 1 1 PC43202,PC43203T43232,T43234F43224,FC4321026 1 * 1 1 K-43-202A 1 1 1 PC43202,PC43203T43232,T43234F43224,FC4321027 1 * 1 1 K-43-202A 1 1 1 何かが異常と判断した場合の確認時の対応の事例ですが、もし漏れていた場合を考慮し、装置番号を記入しました。PC43202,PC43203T43232,T43234F43224,FC4321028 1 * 1 1 K-43-202C 1 1 1 PC43202,PC43203T43232,T43234F43224,FC4321029 1 * 1 1 R-43-301 1 P43332 T43327 F4333030 1 * 1 1 D-23-804 1 1 TC23816FC23827LC2381631 * 1 1 D-3501 1 1 1 T3533 LC3507,LC3508RAW32 1 * 1 1 運転停止機器の潤滑油の事例で、物は潤滑油、温度は外気温、圧力は0.7MPa程度と予想33 * 1 1 D-2201E 1 1 1 PC2203 T220834 * 1 1 P-8491 1 1 1 P3531 T3501 FC357035 1 * 1 136 1 * 1 1 非定常作業の事例です。この時のガスはNH3&N2ガス、温度は常温、圧力は0.08MPaです。37 * 1 1 D-3524 1 1 PC353338 * 1 1 D-3524 1 1 PC353339 1 * 1 1 D-4504 1 1 1 1 P4530 LC4507 *

HHカード№

Page 50: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

37

ここで、設備や装置を表す「装置番号」が選択されたヒヤリハット報告と結合されている。

また、さらなる情報として当該ヒヤリハットが「ヒューマンファクタ」か「設備・装置起

因」の分類、その原因に関連するプロセス値(圧力,温度,流体,弁)の情報が付与されている。

2.3.5 クラスタリングによる分析観点の抽出

理論オントロジーとは異なるアプローチとして、クラスタリングを用いてヒヤリハット

報告の自由記述箇所から自動的に分析の観点(=確率推論における状態の1つ)を抽出する可

能性について述べる。自動的に観点を抽出する事により、オントロジーとして未定義であ

った観点も柔軟に取り込めるという効果が期待される。

以下では、(1)観点抽出のためのクラスタリングの方法論、(2)クラスタリング結果から不

要な観点を減らすための方法論について調査した結果を報告する。本クラスタリング結果

を確率推論に取り入れた効果検証については、今後、実施する必要がある。

2.3.5.1 クラスタリングの手法の選定

観点抽出に向けたクラスタリング手法としては、最も広く利用されているトピック解析

手法である Latent Derichlet Allocation (LDA)[2.3-3]を選定した。LDA は、文書群の中に

潜在的にトピック(話題)が存在し、文書が含むトピックの各々から単語が生成されるこ

とで当該文書が生成されるという仮定に基づき、文書からの各トピックの生成確率(各文書

がどういうトピックを主に含んでいるか)や、トピックからの各単語の生成確率(各トピック

にはどういう単語が良く現れるか)を推定できる。文書が各トピックに帰属する確率を、文

書が各クラスタに帰属する確率と見做すことで、トピック解析による文書クラスタリング

を実現することができる(図 2.3-2 参照)。この際1つのトピックを1つの分析観点と見做

すことで、結果としてヒヤリハット報告全体からの観点の自動抽出が行える。

クラスタリングの手法には、トピックを用いない k-means 法[2.3-4]などの手法も知られ

ている。しかしながら、後述するように、抽出した分析観点に基づいた確率推論を行うこ

とを考えると、文書の各分析観点への帰属確率が直接的に得られた方が確率推論と自然に

結合できると考え、トピック解析に基づく手法を採用した。

2.3.5.2 ヒヤリハット報告のクラスタリング

モデル事業所から提供されたヒヤリハット報告の項目の抜粋を表 2.3-4 に示す。ヒヤリハ

ット中の自由記述は「どこで」、「何をしていた時」、「ヒヤリハット体験の内容」、「感じた

ことを一言」、「考えられる対策」、「コメント」の6つである。以下、その内容を簡単に説

明する。

- 「どこで」には、機器やセンサーの名称が端的に記述されている。

- 「何をしていた時」には、ヒヤリハットを発見した際に行っていた作業が10文字

程度で記述されている。

Page 51: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

38

図 2.3-2 トピック解析に基づくクラスタリング

- 「ヒヤリハット体験の内容」には、ヒヤリハットを発見した状況の記述から始まり、

主に発生しているヒヤリハットの事象が記述される他、その危険性、ヒヤリハット

発生の原因、発見時の心理の記述、場合によっては対策手段が記述される。

- 「感じたことを一言」には、主に発見者の主観によるヒヤリハット発生の原因が記

述される他、発見時の心理や対策方法が記述されることもある。

- 「考えられる対策」には、ヒヤリハット発見者が考えるヒヤリハットの対策手段が

記述される。

- 「コメント」には、発見者の上司からのコメントが記述される。主にヒヤリハット

発見の評価と対策手段の示唆、場合によっては上司視点でのヒヤリハット事象の再

認識や原因の再認識が記述されることもある。

以上の項目から、確率推論の観点として客観的に有用と思われる軸を2つ選定した(以

下、観点の軸を表すのに<, >で括る表記を利用する)。1つは機器の破損や操作ミスなど、

危険につながり得る事象を<問題>として扱うこととした。もう1つは、<問題>を抑止・防

止するための<対策>を扱うこととした。一方で<問題>を生じる<原因>は<問題>との区別が

つかないことが多いため、今回は<問題>と一括りに扱うこととした。また、発見時の<心理

>やヒヤリハットの<評価>は主観性が高く容易に揺れが生じうるため、対象としないことと

した。更に、<発生場所>は主に「どこで」に自由記述されているが、末尾の“にて”を削る

1.0 (クラスタへの帰属確率)

0.7 (以下同上)

Page 52: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

39

という様な簡単な整形を施した上で直接分析の観点として扱う方が妥当と考え、クラスタ

リングによる観点抽出の対象からは外すこととした。

表 2.3-4 ヒヤリハット報告の項目(抜粋)とその具体例

いつ 2014 年 4 月 19 日(土曜日) ■1勤 □2勤 □3勤

どこで 機器Aにて

何をしていた時 消火栓の点検中

ヒヤリハット体験の内

防災訓練が予定されている機器A地区内の消火栓ノズルを

点検していると、ノズル上部のコック弁?用のハンドルが設

置されていなかった。風で飛ばされる程・・

直接的な原因 □確認不足 □錯覚した ・・・

HF要因 技術面 □経験豊富・慣れすぎ □不慣れ ・・・

身体面 ・・・

・・・

感じたことを一言 有るべき姿でないと、いざと言う時に困ると思う。

考えられる対策 他の消火栓ノズル同様にハンドルを設置した。

コメント 本人の対策通りで問題はないと考えます。

2.3.5.3 アノテーション技術によるノイズ低減

<問題>や<対策>に属する観点をクラスタリングにより抽出する最も容易な方法は、<問

題>、<対策>がそれぞれ最も密度高く記述される「ヒヤリハット体験の内容」や「考えられ

る対策」の全体をクラスタリング対象にすることである。しかしながら、2.3.5.2 項で述べ

たように、最も<問題>の記述密度が高い「ヒヤリハット体験の内容」であっても、発見時

の心理や対策など、<問題>と関係のない記述が多数含まれる。実際に、ヒヤリハット全 3279

件から「ヒヤリハット体験の内容」全体を対象に LDA を用いて抽出した観点の例を表 2.3-5

に示す。結果、<問題>と呼べる観点が多く抽出できているが、分析観点 T5 として、「危険

があると感じた」という様な<心理>に属する観点がノイズとして混入してしまっている。

また、上述の通り、<問題>の記述密度が低い「コメント」中にも<問題>が記述されること

があるため、「ヒヤリハット体験の内容」だけに絞ったクラスタリングでは、抽出される観

点に抜けが生じる可能性がある。

そこで、A1 テーマのアノテーション技術を利用して、<問題>、<対策>に対応する記述の

みを抜き出した上でクラスタリングすることで、ノイズ削減を試みた。具体的には「ヒヤ

リハット体験の内容」、「感じたことを一言」、「考えられる対策」、「コメント」の4項目を

処理の対象に、<問題>の観点抽出時には、<FAULT>タグ中の表現を、<対策>の観点抽出

時には<REPAIR>タグ中の表現をクラスタリングの対象とした。

Page 53: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

40

表 2.3-5 <問題>クラスタ中のノイズの例

分析観点 ID 分析観点の詳細

T1 落ちてはいけないものが落ちそう、落ちている

T2 弁・バルブの操作ミス

T3 (危険があると感じた系の表現)

T4 予期しない液体がある

T5 何かに躓いて転びそう

ノイズ削減の効果を客観的に計る為、日本語評価極性辞書[2.3-5]のネガティブ表現を用い

た簡易評価を行った。ネガティブ表現は、不足、失敗、破損という様なネガティブな印象

を与える表現が集められた辞書であり、抽出した観点を特徴づける単語にネガティブ表現

が多いほど、より<問題>にシフトした観点が抽出できていると仮定した。「ヒヤリハット体

験の内容」を直接クラスタリングした場合と、アノテーション技術を利用した場合の各々

について、抽出された 100 の観点を特徴づける 20 の単語、のべ 2000 語とネガティブ表現

の重なりを調べたところ、アノテーション技術を利用した場合に、倍近くのネガティブ表

現が含まれることが判った(表 2.3-6 参照)。これによりアノテーション技術によるフィル

タを行った場合に、分析観点をノイズ少なく自動抽出できる可能性が示唆された。但し、

アノテーション技術の利用により、観点生成に悪影響が無いかは、今後、検証を通じて、

確認する必要がある。

最終的に得られたクラスタリング結果の例を図 2.3.-3 に示す。各行が1つのヒヤリハッ

ト報告に対応しており、図中の EH 列~ES 列が<問題>に属する観点の上位 12 個を、図中

の IE 列~IP 列が<対策>に属する観点の上位 12 個を示している。図中の赤いセルは、ヒヤ

リハットごとに帰属確率が特に高い観点となる。例えば、図中の 155 行目と 156 行目のヒ

ヤリハットは、<問題>観点 T6 への帰属確率が共に 0.5 以上と高いが、共に「ブレンド量の

ミニマム流量を下回る」という概念を含んでおり、複数のヒヤリハットから共通の概念が

観点として抽出されていることが判る。

表 2.3-6 ネガティブ表現数の比較

クラスタリング方法 ネガティブ表現数

アノテーション技術なし 97

アノテーション技術あり 192

Page 54: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

41

図 2.3-3 クラスタリング結果の例(HH:ヒヤリハット)

2.3.6 ベイジアンネットワークによる確率推定

本オントロジーにより割り付けた「理論的原因」、不具合報告書に記入された「HF」お

よび TAG を属性とする設備・装置の情報を構成要素とするベイジアンネットワークを構築

して確率推論を行う。ベイジアンネットワーク[2.3-2] とは、因果関係を確率により記述す

るグラフィカルモデルである。因果関係を矢印で表し、関係の強さを条件付き確率表(CPT)

で表す。本ネットワークは非循環有向グラフであり、通過済のルートに戻ってこないグラ

フのみを扱うことができる。ベイジアンネットワークを用いる事で、「原因→結果」の因果

から得られる確率を用いて、結果が起きたときの原因が何であったのかという可能性(事後

確率) を定量的に求めることができる。

ここでは、石油精製プロセスにおける事故の理論的原因、HF、および関連 TAG との関

係を確率的に推定する。ベイジアンネットワークによる確率推論とは、任意ノードの推論

結果によるモデルに対して、ノードの確率値を証拠状態に設定(強制的に確率値を 1.0 にす

る)したときに他ノードの発生確率を推論することである。

常圧蒸留装置(TP)における理論オントロジーと HF による確率推論の結果例を以下の図

に示す。ここでは、条件確率表の黄色で記載した項目が証拠状態である。

Page 55: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

42

図 2.3-4 理論オントロジーと HF による確率推論(TP)

2.3.7 確率推論による解析事例と考察

(1)設備ごとの理論オントロジーと HF による確率推論の結果例を以下の表に示す。

表 2.3-7 理論オントロジーと HF による確率推論

(

(2)理論オントロジーから TAG 方向の推論をダウンストリーム分析とし、TAG 情報から

理論オントロジー方向への推論をアップストリーム分析とする。

TP のダウンストリーム分析の事例を以下の表に示す。

場所・装置 論理的一次要因 論理的二次要因 論理的三次要因 論理的四次要因 論理的五次要因 論理的六次要因 HF 要因(拡散化前) HF 要因(拡散化後)

統合計器室 100000 プロセス異常 110000 化学組成 113000 化学反応速度 113200 目的反応速度過小 113240 副原料分圧過小 113241 副原料供給量過小 連絡面 上司の指導不足,次直への申し送り不十分,指示・説明不足,連絡不足

No.2T/P 100000 プロセス異常 110000 化学組成 112000 化学平衡 112100 平衡定数過大 112110 温度過大 112112 加熱過大 心理面 他

112200 平衡定数過小 112220 温度過小 112222 加熱過小 心理面,配慮面 習慣的に行動,思いこみ,相手への配慮不足

112300 平衡右シフト 112320 全圧過小 112323 漏洩 心理面 思いこみ,性格等

112400 平衡左シフト 112430 原料分圧過小 112431 原料供給量過小 技術面,心理面,連絡面 危険性の理解不足,知識不足,思いこみ,習慣的に行動,上司の指導不足

500000 機械的危険 心理面 習慣的に行動

No.4LGO-H/T 100000 プロセス異常 110000 化学組成 113000 化学反応速度 113200 目的反応速度過小 113210 温度過小 113212 加熱過小 心理面 面倒,習慣的に行動,思いこみ ¥¥ ¥cline{7-10}

113230 原料分圧過小 113231 原料供給量過小 心理面 面倒,焦り・あわて,気の緩み・気の散り

No.7N-H/T 200000 火災的危険 230000 危険物漏洩 技術面,心理面 危険性の理解不足,思いこみ,習慣的に行動,性格等,面倒

No.1B/Z 200000 火災的危険 230000 危険物漏洩 設備面 設備的要因

No.2WWT 500000 機械的危険 心理面 習慣的に行動

No.6VGO-H/T 500000 機械的危険 心理面 習慣的に行動

道路 600000 プラント外 心理面 習慣的に行動

CCR 500000 機械的危険 技術面 危険性の理解不足

No.3P/F 200000 火災的危険 240000 熱媒漏洩 技術面,配慮面,設備面 危険性の理解不足,相手への配慮不足,設備的要因

FTZ-1 500000 機械的危険 心理面 面倒

F-2201A 500000 機械的危険 技術面 危険性の理解不足,経験豊富・慣れすぎ

I/S 500000 機械的危険 技術面,心理面,連絡面 不慣れ,習慣的に行動,面倒,思いこみ,上司の指導不足

No.2D/U 500000 機械的危険 技術面,心理面 危険性の理解不足,経験豊富・慣れ,習慣的に行動

Page 56: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

43

表 2.3-8 ダウンストリーム分析の事例(TP)

ここで、「理論的背景・リスク」は、理論オントロジーの項目(知識)である。この結果か

ら、技術開発者は「圧力タグのデータ変動による個体詰まりはなぜ起こる?対策は? 」と

考察する。また、設備運転員は「温度・液面タグが変動すると火傷を心配する。 回避する

方法は?」と 考察できる。

TP のアップストリーム分析の事例を以下の表に示す。

表 2.3-9 アップストリーム分析の事例(TP)(TAG 数:2)

ここでは、設備運転員は「習慣的に行動すると温度・液面タグが変動してプラント変動が

起こる場合が多い。潜在的リスクあり」と解釈できる。

関連TAG 装置分類 装置番号 理論背景・リスク

温度T2247,液面LC2215 バルブ P-2206A,P-2206C 有害液体噴出

圧力PD2210 ストレイナー P-7266B 固体詰まり

温度T2252 バルブ E-2221 危険物漏洩

理論背景・リスク HF(大分類) HF(細分類)

有害液体噴出 心理面,設備面 思い込み,習慣的に行動,設備的要因

固体詰まり 技術面,心理面,非定常面 不慣れ,突発的事象により

危険物漏洩 技術面,心理面 危険性の理解不足,他(心理面)

理論背景・リスク 結果の重大性評価(HH)

有害液体噴出 機器破損,火傷・けが

固体詰まり プラント変動

危険物漏洩 油・ガス漏洩,火災・爆発

証拠状態:理論

証拠状態:理論

関連TAG温度T2247液面LC2215

圧力PD2210 温度T2252

理論背景・リスク 有害液体噴出 固体詰まり 危険物漏洩

装置分類 バルブサンプリングストレイナー

バルブ

装置番号P-2206AP-2206C

P-7266B E-2221

HF(大分類)技術面心理面信頼面

技術面心理面

非定常面

技術面心理面配慮面

HF(細分類)

経験不足危険性の理解不足習慣的に行動相互依存

不慣れ焦り・あわてストレス突発的事象により

危険性の理解不足気の緩み・気の散り相手への配慮不足

結果の重大性評価 プラント変動 プラント変動 油・ガス漏洩

証拠状態:TA

G

Page 57: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

44

2.3.8 確率推論の事例(設備別)とモデル事業所による評価

TP、BZ(ベンゼン製造装置)、PF(接触改質装置)、N-HT(ナフサ処理装置)、および

VGO-HT(減圧脱硫装置)の各設備において、変動 TAG を想定してアップストリーム分析

を行い、モデル事業所の技術スタッフの評価を得た。

(1)TP の分析例(3 種類の TAG が変動した場合)を以下の表に示す。

表 2.3-10 アップストリーム分析の事例(TP)(TAG 数:3)

上記に対するモデル事業所のコメントと事故予兆(連想)の可能性に対する評価を以下

に示す。

・コメント1:

TP H2S 系のチャージ FSC2270 のストレーナーの差圧が上昇した場合は、ストレーナー

の詰りが発生した事で、ストレーナーの清掃や詰り落とし作業によるヒューマンエラー

が発生する可能性がある。

・コメント2:T2246 は D-2204 の温度であり、ストレーナー詰りに直接関係はなさそう?

・コメント3:PD2210・FSC2270 の関連性は当然である。

・コメント4:

PD2210 は直接的な要因となるので、計器室担当者としても即対応は可能であるが、

FSC2270 については、流量計そのものの故障もあるので、PD2210 との組み合せで、ス

トレーナー詰りと言う結果に持って行く事では支援として有効と考える。T2246 につい

ては、何故因果関係が有ったのか不明。

※事故予兆(連想)の可能性:○(可能性はある)

関連TAG温度T2246

圧力PD2210流量FSC2270

理論背景・リスク 固体詰まり

装置分類 ストレイナー

装置番号 P-7266B

HF(大分類)技術面心理面

非定常面

HF(局所的)不慣れ

思い込み突発的事象により

結果の重大性評価 プラント変動

Page 58: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

45

(2)BZ の分析例を以下の表に示す。

表 2.3-11 アップストリーム分析の事例(BZ)

ここで、TAG:液面 LC4612, L4623, LC4313 は、装置周辺に配置されているセンサーの

TAG である。

上記に対するモデル事業所のコメントと事故予兆(連想)の可能性に対する評価を以下に

示す。

・コメント1:

事象例はガス循環切替時に思い込みで切り替える弁を間違えた事で、系内圧上昇液面変

動で油ガス抜けを発生する可能性が予想できる。

・コメント2:

サンプル採取時、取り出し弁を無理に操作したので、バルブを破損し、油ガス抜けとな

る可能性が予想できる。

・コメント3:

ドレンノズルのキャップ取外し時、何も考えずにキャップを外したところ、内弁リーク

により、ガスが噴き出す可能性が予想できる。

・コメント4:

液面変動、圧力変動により、抜けに発展する可能性としてはあるが、各変数の許容範囲

も関係するので、そう言った条件を付加すると運転支援としての有効性が見いだせるか

もしれない。

※事故予兆(連想)の可能性:○(複数の事故予想が連想できる)

関連TAG液面LC4612, L4623, LC4313

圧力P4615

理論背景・リスク 危険物漏洩

装置分類 サンプリング, 反応器

装置番号 C-4605

HF(大分類)心理面技術面

HF(細分類)思い込み

危険性の理解不足

結果の重大性評価 油・ガス漏洩

Page 59: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

46

(3)PF の分析例を以下の表に示す。

表 2.3-12 アップストリーム分析の事例(PF)

上記に対するモデル事業所のコメントと事故予兆(連想)の可能性に対する評価を以下

に示す。

・コメント1:

コンプレッサーの異常で予備機に切り替え操作を実施していたが、焦っていたこともあ

り、現場を走ったので、躓いて転んだ。

・コメント2:間接的な内容のため個々では評価は難しい。

※事故予兆(連想)の可能性:△

(4)N-HT の分析例を以下の表に示す。

表 2.3-13 アップストリーム分析の事例(N-HT)

上記に対するモデル事業所のコメントと事故予兆(連想)の可能性に対する評価を以下

に示す。

・コメント1:

C-23802 系のオーバーヘッドクーラー出口温度であるが、オーバーヘッドコンデンサー

関連TAG温度T43232, T43234

圧力PC43202, PC43203流量F43224, FC43210

理論背景・リスク 危険物漏洩

装置分類 コンプレッサ

装置番号 K-43-202A

HF(大分類)心理面

非定常面

HF(細分類)焦り・あわて

突発的事象により

結果の重大性評価 火傷・けが

関連TAG 温度T23857

理論背景・リスク 危険物漏洩

装置分類 バルブ

装置番号 D-23-802, P-23-802

HF(大分類)技術面心理面設備面

HF(細分類)経験豊富・慣れすぎ

性格等設備的要因

結果の重大性評価 火傷・けが

Page 60: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

47

の WCS が低下して温度が上昇した場合、C-23-802 圧力上昇による抜けが発生する可能

性を秘めており、関連性は有る。

・コメント2:

冷却水量低下による温度上昇発生での抜けの可能性は無きしにも非ずだが、そこに至る

までの過程で圧力変動等もあるので、放置しておく事は現実的には運転上、有り得ない。

教育題材としては使用できるかもしれない。

※事故予兆(連想)の可能性:×(1TAG では想像性に欠ける)

(5)VGO-HT の分析例を以下の表に示す。

表 2.3-14 アップストリーム分析の事例(VGO-HT)

上記に対するモデル事業所のコメントと事故予兆(連想)の可能性に対する評価を以下

に示す。

・コメント1:

廃熱ボイラーの入口・出口温度とスチームドラムの圧力・WBFH 供給流量であり、危険

物の抜けは不明、廃熱ボイラーのため、温度が上昇し続けるとは考えられないが、圧力

上昇によりスチーム抜けの可能性は予想できる。

・コメント2:

ヒヤリハットからどう言った因果関係が生じたかは不明であるが、設備的欠陥による結

果事象の発生として、教育題材には使用できるかもしれない。

※事故予兆(連想)の可能性:○(可能性あり/教育効果有り)

モデル事業所の総合コメント:

(1)今後の有効利用について、例えば BZ、PF の分析については、よりプラントに詳しい

技術スタッフが参加すると、更なるトラブル(事故連想)を想像することができそう。

(2)関連 TAG は多数存在するので、より多様な TAG 変動で検討する必要がある。

関連TAG温度T3598A2, T3598B1

圧力P3512, PC3561流量FC3561

理論背景・リスク 危険物漏洩

装置分類 ジョイント・パッキン

装置番号 D-3514

HF(大分類) 設備面

HF(細分類) 設備的要因

結果の重大性評価 火傷・けが

Page 61: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

48

2.3.9 まとめ

石油精製プロセスの事故に関する化学知識に基づく理論オントロジー、ヒヤリハット報

告、およびセンサーTAG 情報を属性とする設備・装置情報を構成要素として結合したデー

タベースにベイジアンネットワークを適用して確率推論を行った。5種類の設備について

単一、および複数の TAG を変動させたアップストリーム分析を行い、モデル事業所(技術

スタッフ)の評価を受けた。この結果、限定的であるものの複数 TAG の変動による分析結

果から、事故予兆の気付きとなる可能性があることや教育効果がある旨のコメントを得た。

今後は、プラントに精通した技術スタッフと協力して、多様な TAG 変動時のアップストリ

ーム分析などを行い、本技術の厳密な検証を行うことで、コンビナートの保安における情

報自主保安の高度化に繋げたいと考える。

今後は、結合データベースの件数を増加させ、確率推論の統計的な信頼性の向上を図る。

また、ヒヤリハットの詳細分析(A1 テーマ:アノテーション情報)結果や各ヒヤリハット

が「ヒューマンファクタ」か「設備・装置起因」の分類やその原因に関連するプロセス値

(圧力、温度、流体、弁)の付与情報とともに、過去の事故事例データベースを紐付けた

推論を行い、推論や予測の範囲(知見)の拡大を目指す。

2.3.10 ビッグデータ活用の有効性実証の IoT 展開

事業に関わる研究者・技術者、設備運転員、管理者、あるいは安全有識者(リスクマネ

ージメントを専門とする)によって、異なる思想や考え方で事故の予兆や対策の立案が行

われる。そこで、IoT 環境のもとで多様な立案結果を人間社会における相互作用をモデル化

することを特徴とする分散人工知能(Distributed Artificial Intelligence: DAI)で勘案し、意

思決定を支援するシステムを提案する。ここでは、インターネット上の各種のプロセスの

変動や B テーマ(B1・B2)のオンライン解析結果で TAG を「変動」させる。ここで「変

動」とは、センサー情報より何らかのプロセスの変動を示すことをいう。次に、研究者・

技術者、設備運転員、管理者、あるいは安全有識者に対応する(見立てた)各種エージェ

ントが分散協調問題解決(DPS)によって事故予測や対策案の候補を立案して管理者に提

案する。この中には、複数 TAG の変動による未発生の事故が含まれる。管理者はこれらを

活用して、対策や指示の意思決定を行う。要素技術としては、マルチエージェント技術や

確率推論技術(ベイジアンネットワーク)が内在する。IoT 環境における知的自主防災のコ

ンセプトを以下の図に示す。

Page 62: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

49

図 2.3-5 IoT 環境における知的自主防災のコンセプト(HH:ヒヤリハット)

[参考文献]

[2.3-1] 古崎晃司:オントロジー構築入門よりよいオントロジー構築のための考え方

と指針,日本図書館研究会整理技術研究グループ月例研究会(2006)

[2.3-2] 本村陽一, 岩崎弘利:ベイジアンネットワーク技術ユーザ・顧客のモデル化と

不確実性推論,東京電機大学出版局,(2006)

[2.3-3] Blei, David M.; Ng, Andrew Y.; Jordan, Michael I. Lafferty, John, ed. "Latent

Dirichlet Allocation". Journal of Machine Learning Research 3 (4–5): pp. 993–1022. (2003)

[2.3-4] Arthur, D.; Vassilvitskii, S. “k-means++: the advantages of careful

seeding”. Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete

algorithms. Society for Industrial and Applied Mathematics Philadelphia, PA, USA.

pp. 1027–1035 (2007)

[2.3-5] 小林のぞみ,乾健太郎,松本裕治,立石健二,福島俊一. 意見抽出のための評価表現の

収集. 自然言語処理,Vol.12, No.3, pp.203-222 (2005)

運転員

Page 63: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

50

2.4 B1:プロセスデータに基づく外れ値検出

2.4.1 概要

本章では、モデル事業所の操業に関する各種ログデータ(プロセスデータ)から通常と

は異なる状態(外れ値)を検出し、それを計器室担当者に提示することで、気づきや注意

喚起を与えられるか、事故抑止の可能性があるかを検証する。外れ値の検出は、あらかじ

め通常運転時の状態モデルを構築しておき、そのモデルから逸脱したときに外れ値とみな

すことによって行う。外れ値として検出されたときと同時期に書かれたヒヤリハットの調

査や、検出時刻での該当装置の動作をモデル事業所の技術スタッフにヒアリングすること

を通して、外れ値検出の評価を行った。

上記を通して、以下の知見が得られた。

①自動抽出した高相関のセンサーペアを属性に用いた 1 クラス SVM を用いることで、

運転モードや時間変化に頑健な外れ値検出ができた。

②今回検証を行った範囲では、従来見落とされていた問題は発見されなかったが、反応

装置や測定機器の劣化がセンサー間の相関性のずれによって発見でき、外れ値状態にな

る前に対処できる可能性が示唆された。

③上記高相関のセンサーペアの関係を計器室担当者にフィードバックすることで、計器

室担当者の支援や技術伝承にも利用できる可能性があることが示唆された。

次項以降で内容を詳細に報告する。

2.4.2 外れ値検出手法

本調査研究にて使用した外れ値検出手法について、本項で述べる。

2.4.2.1 全体概要

本調査研究では、教師無し外れ値検出手法である、マハラノビス距離による外れ値検出

と 1 クラス SVM による外れ値検出を試行した。

外れ値検出の手法には大きく2つのアプローチがある。

①人手で検出ルールを作成するアプローチ

②統計的なアプローチ

①は動作が明確で広く使われているが、ルール作成にノウハウが必要であり、明らかな

外れ値状態にならないと検出できず、予兆検出には向かないため、②のアプローチを採用

する。

外れ値検出では、センサーの値の動きには、本来、あるべき正常パターンが存在してお

り、そのパターンと逸脱する値を外れ値として見なすことができるという考えに基づいて

Page 64: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

51

いる。外れ値検出手法は、正常値または外れ値とラベル付けされたデータセットを用いる

「教師あり外れ値検出」と、そのようなラベル付けデータを用いず、正常とみなされる期

間に得られたデータである訓練データからモデルを生成し、モデルとの乖離度によって外

れ値を発見する「教師無し外れ値検出」とがある。一般にプラントにおける外れ値検出に

おいて教師データがある状況は少なく、本分析においても、ラベル付けされたデータセッ

トが存在しないため、教師無し外れ値検出の手法を採用する。

教師無し外れ値検出の概要を図 2.4-1 に示す。まず、与えられた時系列データに対し、訓

練期間・テスト期間をそれぞれ決める。訓練期間は検出対象である外れ値が含まれていな

いと考えられる通常運転期間を選ぶようにする。次に、訓練期間のデータを用いてモデル

を学習する。最後に、テスト期間の各時点のデータに対して、学習させたモデルに基づき

外れ値スコアを計算し、スコアが予め定めた閾値を超えている場合に、そのデータを外れ

値と見なす。

実際の外れ値検出においては、過去の通常運転時を訓練期間としてモデルを事前に学習

しておき、最新のデータに対して、リアルタイムに外れ値スコアを計算することで、外れ

値状態を即座に発見できる。

図 2.4-1 外れ値検出処理のフローチャート

ここで注意すべきこととして、テスト期間中に複数のセンサーが同じような値の変動を

する場合でも、該当センサーの訓練期間中の値の動きが異なれば、両者の外れ値スコアは

異なったものとなる。端的に述べると、訓練期間中で分散が大きい属性は、テスト期間中

に大きく変動しても必ずしも外れ値と見なされず(図 2.4-2 の青線)、一方、訓練期間中で

ほぼ一定の値だった属性は、テスト期間中に少し値が変化するだけでも、外れ値として判

定されることがある(図 2.4-2 の赤線)。

Page 65: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

52

図 2.4-2 訓練期間・テスト期間に対する外れ値判定のイメージ

今回の分析においては、プロセスデータの外れ値検出の手段として、多次元数値データ

に適用可能な

①マハラノビス距離による外れ値検出[2-1]

②1 クラス SVM による外れ値検出[2-2][2-3]

の 2 つの手法を試行した。それぞれの手法について、2.4.2.2 項、および 2.4.2.3 項にて詳細

に述べる。

2.4.2.2 マハラノビス距離による外れ値検出

マハラノビス距離による外れ値検出のフローチャートを図 2.4-3 に示す。図内の学習・テ

ストで行われる処理およびその出力について、以下で説明を行う。

図 2.4-3 マハラノビス距離による外れ値検出

マハラノビス距離を用いる手法における訓練ステップは、各属性値の平均ベクトル μ お

よび共分散行列 Σ を計算することによって行われ、それらの値は訓練期間中のベクトル列

(𝑥1,⋯ , 𝑥𝑚)から以下の式で求められる。

Page 66: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

53

μ =1

𝑚∑ 𝑥𝑖

𝑚

𝑖=1

Σ =1

𝑚∑ (𝑥𝑖 − 𝜇)(𝑥𝑖 − 𝜇)𝑇

𝑚

𝑖=1

この μ および Σ で定義されるモデルに対し、テストステップにおいて、テスト期間中の

ベクトル𝑥のマハラノビス距離𝐷(𝑥)を以下の式で計算し、これを外れ値スコアとする。

𝐷(𝑥) = √(𝑥 − 𝜇)𝑇𝛴−1(𝑥 − 𝜇)

マハラノビス距離の値は、モデルの平均ベクトルの値から離れるほど大きくなるという

性質を持ち、それが一定の閾値 θ より大きい場合、そのデータは外れ値であると見なすこ

とができる。

以下にマハラノビス距離のイメージ図を示す。μ が楕円の中心、Σ が楕円の形状を決定し

ており、中心から離れているデータほどスコアが高くなるため、外れ値として判定されや

すくなる。また、中心からユークリッド距離で等距離であるデータに対しても、分散が小

さい属性に対して離れている、あるいは相関に逆らっているベクトルのスコアがより大き

くなり、外れ値として検出されやすくなっている。

図 2.4-4 マハラノビス距離による外れ値判定のイメージ

以上で説明したマハラノビス距離は外れ値検出の手段として広く用いられているもので

あるが、マハラノビス距離の計算には以下のような問題点がある。

・訓練期間中、常に値が一定の属性があったり、相関が非常に大きい属性ペアがあった

りする場合、共分散行列の逆行列が計算出来ない場合がある。

・また、逆行列が計算できたとしても、誤差の影響で外れ値スコアが非常に大きな値に

なったり、虚数になったりする場合があり、適切な外れ値検出が行えない場合がある。

Page 67: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

54

2.4.2.3 1 クラス SVM による外れ値検出

1 クラス SVM による外れ値検出における図 2.4-1 の訓練ステップは、パラメータとして

外れ値データの全データに対する割合 ν を与え、訓練期間中のデータの(1-ν)*100%を正常

値として覆うモデルを生成することによって行われる(図 2.4-5 を参照)。このモデルは、

複数のサポートベクトル𝑥𝑖とその係数𝛼𝑖、および定数 γ、ρ によって定義される。

図 2.4-5 1 クラス SVM による外れ値検出のイメージ

これに対し、テストステップでは、テスト期間中の各時点のデータがモデルに対して正

常値の範囲に入っているか否かを計算することで、外れ値検出が行われる。具体的には、

以下の式で計算される外れ値スコアの値が一定の閾値を下回るもののみを、外れ値として

検出する。

∑𝛼𝑖𝑒𝑥𝑝(−𝛾‖𝑥 − 𝑥𝑖‖22) − 𝜌

𝑖

1 クラス SVM を用いる手法は、マハラノビス距離によるものとは異なり、プロセスデー

タに対し、そのまま適用しても、外れ値検出では十分な精度を得ることができなかった。

そのため、データを正規化した上で、各センサーの値をそのまま使用する代わりに、セン

サーのペアの中で相関が高いものを新たな属性として用いた。高相関ペア属性により予測

された値と実際の値とのズレをその属性の値とする前処理を行い、得られたデータに対し、

1 クラス SVM を適用するものとする。フローチャートを図 2.4-6 に示す。

Page 68: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

55

図 2.4-6 1 クラス SVM による外れ値検出

まず、正規化処理は以下の通り、行う。データの各属性値に対し、訓練期間中の値系列

の平均 μ・分散 v を求め、平均が 0、分散が 1 となる正規化を、式𝑥′ = (𝑥 − 𝜇) √𝑣⁄ により実

施する。また、テスト期間中のデータについても、同じ式により、補正を行う。

次に、正規化を行ったデータに対し、各属性の代わりに、属性のペアを新たな属性とし

た訓練・テストデータを生成し、それらに対して 1 クラス SVM による外れ値検出を適用す

る。ここで、すべての属性のペアを使用した場合、新たな属性の数は元の属性数 n に対し

て、n(n-1)/2 に増加してしまうため、相関度の高いペアのみ残すように選別を行う。例えば、

図 2.4-7 の左図のような相関度の高い属性ペアは採用し、右図のような相関度の低い属性ペ

アは採用しない。

属性ペア間の相関度は訓練データに対して算出し、相関関係から導き出される予測式に

したがって予測誤差を計算し、新たな属性の値とする。テストデータに対しては、訓練デ

ータから導きだされた予測式と同じ式を用いて予測誤差を計算する。

Page 69: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

56

図 2.4-7 相関の高い(左)/低い(右)属性ペアの例

2.4.3 外れ値検出実験

2.4.2 項で説明したマハラノビス距離、1 クラス SVM を用いた手法によって外れ値検出

ができるか実験を行った。

2.4.3.1 対象装置、使用したデータ

今回の実験においては、以下の 4 つの装置のプロセスデータを用いることとした。

表 2.4-1 実験に使用した装置

装置 ID 装置名 センサー数

(除外前)

センサー数

(除外後)

WWT 廃水処理装置 109 109

BZ ベンゼン製造装置 426 290

TP 常圧蒸留装置 677 515

L-HT 軽油脱硫装置 629 464

対象装置の選定はモデル事業所へのヒアリングに基づいて行った。WWT は最も規模が小

さく、センサー数が少ない装置である。BZ は高温、高圧になるため、安全管理が重要な装

置である。TP は石油精製の要となる装置で、規模も大きい。L-HT は運転変更が多く、人

手による介入が多い装置である。

各装置には、流量、圧力、温度等の複数のセンサーが取り付けられており、10 分間隔の

時系列データを記録している。「観測に失敗した」などの理由で、数値の代わりに”Bad”や”No

Data”という文字列が入っていることがあるが、そのような欠損データに対しては、直近の

正常な値をホールドする補完処理を行ったうえで、以後の処理に用いた。

また、外れ値検出のために不要なセンサーは除外して実験を行った。除外の基準は以下

の 4 種である。

Page 70: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

57

・i. 訓練期間において常に一定の値をとるもの

これらはモデル学習において不要であり、特に、マハラノビス距離を算出するための逆

行列が求められなくなるため、除外した。

・ii. カテゴリ値をとるもの

フラグやスイッチのような少数の値しかとらないものは除外した。

・iii. 不定期に値が大きく変動するもの

試験結果が入力されるセンサー等の不定期に値が変更されるものは除外した。

・iv. その他、特に除外したもの

訓練期間とテスト期間で大きく動きが異なるものやセンサーの劣化により、徐々に値が

変化していくものは外れ値検出実験で大きな影響を及ぼすことがあり、技術スタッフに

ヒアリングの上、除外した。

上記に該当するセンサーを除去した結果、各装置に対して使用したセンサーの個数は、

表 2.4-1 の最右列の通りとなった。

2.4.3.2 実験結果

これまでに説明したマハラノビス距離および 1 クラス SVM による外れ値検出結果を、

WWT、BZ、TP、L-HT の各装置に対して適用した結果についてここで述べる。

実験ではモデル学習に用いる訓練期間として、2013 年の定修後に安定した運転をしてい

る期間を選び、テスト期間として 2014 年のデータを用いた。安定した運転をしているかど

うかの判断は、フィード量を示すセンサーの値によって行い、表 2.4-2 で示した期間を用い

て実験を行った。

表 2.4-2 データの訓練期間

装置 ID 訓練期間 テスト期間

WWT 2013/06/26 ~ 12/03 2014/01/01 ~ 12/31

BZ 2013/08/16 ~ 12/31 2014/01/01 ~ 12/31

TP 2013/08/04 ~ 12/31 2014/01/01 ~ 12/31

L-HT 2013/08/08 ~ 12/31 2014/01/01 ~ 12/31

また、高相関であるとみなされて抽出されたペア属性の個数を、表 2.4-3 に示す。

表 2.4-3 ペア属性の個数

装置 ID 訓練期間 ペア属性の個数

WWT 2013/06/26 ~ 12/03 68

BZ 2013/08/16 ~ 12/31 521

TP 2013/08/04 ~ 12/31 331

L-HT 2013/08/08 ~ 12/31 1573

Page 71: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

58

2.4.3.2.1 相関ペア属性を用いずに 1 クラス SVM を適用した結果

まず、センサー間の相関関係を考慮せずに単体のセンサーの値を属性として 1 クラス

SVM を適用した。結果は図 2.4-8 の通りである。1 クラス SVM の外れ値スコアは値が小さ

いほど、外れ値の度合いが大きくなる。比較的単純な装置である WWT でも、ほとんどの

期間で下限に近い値をとっており、その他の 3 つの装置ではテスト期間の早い段階でスコ

アが下限値に張り付いてしまっている。そのため、適切な外れ値検出が出来ない結果とな

った。これは、各センサーの値が運転変更、気象条件、経年変化等の影響により少しずつ

ずれていき、装置全体としての変化が無視できないほどに大きくなったためと考えられる。

このように単体のセンサーの動きだけを使って外れ値検出を行うことは困難であるため、

属性間の相関関係を考慮しているマハラノビス距離やペア属性を用いた1クラスSVMを用

いた外れ値検出を検討した。

次の 2.4.3.2.2 項以降で各装置における外れ値検出の結果について述べる。

図 2.4-8 相関関係を考慮せずに 1 クラス SVM を適用した結果

(値が小さいほど外れ値の度合いが大きい)

2.4.3.2.2 廃水処理装置(WWT)に対する適用結果

WWT に対して、マハラノビス距離による外れ値検出、高相関ペア属性を用いた 1 クラス

SVM による外れ値検出を行った結果を、図 2.4-9 と図 2.4-10 に示す。

Page 72: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

59

図 2.4-9 マハラノビス距離(WWT)

(値が大きいほど外れ値度合が大きい)

図 2.4-10 高相関ペア属性を用いた 1 クラス SVM(WWT)

(値が小さいほど外れ値度合が大きい)

WWT はテスト期間内において装置の清掃のための運転停止が 3 回(4 月末~5 月初め、

8 月、12 月)、両手法によって外れ値と判定できている。マハラノビス距離による結果はス

コアの値のレンジが非常に大きくなったため、対数軸でプロットを行っている。1 クラス

SVM による手法では、9 月以降に多くの箇所でスコアが下がり、外れ値と判定されている

Page 73: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

60

が、これは技術スタッフへのヒアリングにより、制御機器の劣化による影響と判明した。

マハラノビス距離についても同時期にスコアが高くなっていることが確認できるが、スコ

アのレンジが広く、この様な影響を検知するための閾値設定は難しい。

2.4.3.2.3 ベンゼン製造装置(BZ)に対する適用結果

BZ に対して、マハラノビス距離による外れ値検出、高相関ペア属性を用いた 1 クラス

SVM による外れ値検出を行った結果を、図 2.4-11 と図 2.4-12 に示す。

図 2.4-11 マハラノビス距離(BZ)

(値が大きいほど外れ値度合が大きい)

Page 74: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

61

図 2.4-12 高相関ペア属性を用いた 1 クラス SVM(BZ)

(値が小さいほど外れ値度合が大きい)

マハラノビス距離による手法では、特定のセンサーの動きに大きな影響を受けた結果と

なっている。このような場合、検出のための閾値を適切に設定することが難しい。一方、1

クラス SVM による手法では上記のような影響は見られない。ただ、時間が経つにつれて外

れ値度合いが大きくなっている傾向がある。これは、BZ 装置が高温の箇所が多く、温度セ

ンサーは経年劣化により、温度の値がずれる傾向があることが理由である。

2.4.3.2.4 常圧蒸留装置(TP)に対する適用結果

TP に対して、マハラノビス距離による外れ値検出、高相関ペア属性を用いた 1 クラス

SVM による外れ値検出を行った結果を、図 2.4-13 と図 2.4-14 に示す。

Page 75: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

62

図 2.4-13 マハラノビス距離(TP)

(値が大きいほど外れ値度合が大きい)

図 2.4-14 高相関ペア属性を用いた 1 クラス SVM(TP)

(値が小さいほど外れ値度合が大きい)

マハラノビス距離による方法ではスコアのレンジが広く対数軸でプロットしている。広

いレンジに加えて、右肩上りのスコア変化となっており、適切な閾値設定は困難である。

一方、1 クラス SVM による方法ではこの様な影響は見られない。

Page 76: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

63

2.4.3.2.5 軽油脱硫装置(L-HT)に対する適用結果

L-HT に対して、マハラノビス距離による外れ値検出、高相関ペア属性を用いた 1 クラス

SVM による外れ値検出を行った結果を、図 2.4-15 と図 2.4-16 に示す。

図 2.4-15 マハラノビス距離(L-HT)

(値が大きいほど外れ値度合が大きい)

図 2.4-16 高相関ペア属性を用いた 1 クラス SVM(L-HT)

(値が小さいほど外れ値度合が大きい)

Page 77: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

64

マハラノビス距離による方法では、ほぼ半数の時刻で適切な距離が算出できなかった。

また、スコアが算出できた部分についても、適切な外れ値検出が出来ていない状況を示し

た。これはマハラノビス距離の算出に用いる共分散行列の逆数が正しく計算できなかった

ためで、センサー間の相関が非常に大きいものが含まれていることが原因と考えられる。

適切な外れ値検出を行うためには、この様なセンサーの値を除外してモデルを学習する必

要があり、個別のチューニングが必要になり、実用化の観点で難があると考える。一方、1

クラス SVM による手法ではこの様な現象はなく、適切な外れ値検出が出来ている。

2.4.3.2.6 実験結果まとめ

これまで見てきたように、プロセスデータに基づく外れ値検出にはセンサー間の相関関

係を考慮する必要があり、その手法として高相関ペア属性を用いた 1 クラス SVM による手

法が様々な装置に対して頑健でもっとも適当であると言える。

マハラノビス距離による手法は検出のための閾値設定が難しいこと、距離算出が条件に

よって出来ない、もしくは不適切になることがあるため、適当ではないことが分かった。

2.4.3.3 技術スタッフへのヒアリング

実験により各装置に対して検出された外れ値に対し、同時期に書かれたヒヤリハットデ

ータとの関係や検出時刻での該当装置の動作をモデル事業所の技術スタッフにヒアリング

することで、外れ値検出の評価と活用の方向性について議論した。

2.4.3.3.1 ヒヤリハットデータとの関連

外れ値と判定された時刻に近い時刻に書かれたヒヤリハットと、当該装置に関するもの

は 9 件あり、それぞれについて技術スタッフに関連があるかどうかを判断して頂いた。結

果は、1 件を除いて関連はないと判断頂いた。これらは、外れ値として何らかの操作を行っ

た結果により検出されており、その意味では妥当な外れ値だったが、ヒヤリハットに書か

れている内容は装置のプロセス外の出来事に関するヒヤリハットであり、関係ないとの説

明を受けた。装置の運転変更に関わる内容を行ったときにはヒヤリハットではなく、申し

送り書にその旨を記述する運用とのことであり、今後は申し送り書と外れ値との関連を分

析したほうがよいと考えられる。

「関連あり」と判断された 1 件の内容を以下に示す。

装置 ID: WWT

日時: 2014 年 11 月 20 日 3:50

外れ値とされたプロセスデータの動き:

ある熱交換器の温度の値が 149 から 146 に下落

ヒヤリハット(斜線部を改変):

Page 78: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

65

本来ならば、ポンプ A の吐出弁とポンプ B のバイパス弁を切替えなければいけなか

ったが、誤って、ポンプ A の吐出弁とポンプ A のバイパス弁を切替えてしまった。ボ

ードの指示ですぐに操作 X を行ったので、大事に至らなかった…

※操作 X は 3:47~4:31 の間行っていたとのこと。

この例は、ポンプの切り替え操作を誤った際のリカバリ操作の影響が外れ値として検出

された例である。設備運転員が何らかの操作を行う場合には計器室担当者(ボード)も誤

りがないかどうかを確認しており、この例の場合にも、すぐに誤りに気づき、リカバリ操

作を指示している。そのため、従来、見落としていた問題を発見したという例ではないが、

リカバリ操作によって通常とは異なる動きをした場合の変化を外れ値として適切に検出で

きた。

2.4.3.3.2 制御機器の劣化の検知

前述した WWT 装置で 9 月以降に多くの箇所で外れ値と判定されている原因は、制御機

器の劣化による影響と判明した。図 2.4-17 は関連するセンサーデータの動きである。これ

はある制御機器のプロセス値(PV 値、緑線)とマニピュレート値(MV 値、赤線)を示し

ており、9 月以前と以後で主に MV 値の動きが変化している。プラントでは自動制御により、

指定した PV 値になるように MV 値を自動的に制御する。計器室担当者は主に PV 値をみて

監視を行っている。この例では PV 値は 9 月前後でそれほど変化は見られないが、MV 値が

変化している。これは制御機器内部の詰まりにより、調節弁の開度を大きくしなければ、

PV 値を制御できなくなっていることを示している。この様な状況が続いた場合、いずれ

PV 値の制御も行えなくなり、外れ値状態や事故につながる可能性も否定できない。この様

な PV 値と MV 値との相関性のずれを検出できることにより、機器の劣化度合に気づくこ

とができ、事前対処が可能になると考えられる。

Page 79: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

66

図 2.4-17 制御機器の関連するセンサーデータの動き

2.4.3.3.3 温度センサーの劣化の検知

BZ 装置のスコアは右肩下がりの傾向を示しており(図 2.4-12 参照)、これは温度センサ

ーの劣化によるものであると分かった。図 2.4-18 は、2 つの温度センサーの値(上左、上

右)と、それらの相関性から算出された予測誤差の値(下)である。2 つの温度センサーは

近い場所に設置されているため、相関のある動きをしている。これだけを見ても劣化の度

合を確認できないが、相関性に着目すると時間が経つにつれて予測誤差が大きくなってい

る。温度センサーは取り付け部分の汚れや接着の度合いが徐々に変化することにより、測

定される温度が変化していく。外れ値検出の観点ではノイズになる変化ではあるが、ずれ

のトレンドをみることで、劣化の度合いやスピードを検出できる可能性がある。これは高

温条件が多い BZ や TP で多く発生しており、TP では該当するセンサーを除去して外れ値

検出を行うことで、右肩下がりではなく、フラットなスコア(図 2.4-14 参照)となってい

る。

Page 80: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

67

図 2.4-18 BZ の 2 つの温度センサーの値(上左、上右)

およびそれらの相関性から算出された予測誤差(下)

2.4.3.3.4 外れ値検出結果の計器室担当者への提示について

今回用いた外れ値検出では、外れ値と判断されたときの原因となるセンサー(ペア)を

出力することができる。技術スタッフへのヒアリングでは原因センサーの動きを提示して

判断の材料にしていただいていたが、おおむね正しく外れ値の現象に関わるセンサーを提

示できていた。また、高相関のセンサーペアをモデルとしてもっている。それらの情報を

組み合わせると、外れ値となる現象が起こった際に、どの機器が関係しているかを提示す

ることができる。それによって計器室担当者、特に経験の浅い計器室担当者に対して、何

らかイレギュラーなことが起こった際に、どの機器を着目すべきかの指針を与えられる可

能性があるとの示唆をいただいた。

関連機器を正しく特定できるか、それがベテランの計器室担当者のノウハウと一緒なの

Page 81: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

68

か、異なるのかについては今後の分析が必要になるが、計器室担当者の教育、技能伝承の

観点で相関ペアを活用できる可能性がある。

2.4.4 まとめと提言

2.4.4.1 まとめ

本調査研究では、プロセスデータに基づく外れ値検出を、マハラノビス距離および 1 ク

ラス SVM を用いた 2 つの手法で試行した。両手法による結果を比較すると、マハラノビス

距離を用いた外れ値検出よりも、高相関属性ペアを用いた 1 クラス SVM による外れ値検

出のほうがすぐれていることが分かった。WWT における 3 度の運転停止箇所のような明ら

かな外れ値はどちらの手法によっても検出できているが、マハラノビス距離を用いる手法

では運転モードや時間変化による影響を受けやすく、適切な閾値設定が困難であること、

場合によっては適切な外れ値スコアが算出できないことがある点で、今回対象としたよう

な石油精製プラントの外れ値検出には不適と考えられる。

また、外れ値検出結果を該当装置の技術スタッフに提示し、ヒアリングを行った。その

結果、今回検証を行った範囲では、従来見落とされていた問題は発見されなかったが、反

応装置や測定機器の劣化がセンサー間の相関性のずれによって発見でき、外れ値状態にな

る前に対処できる可能性が示唆された。さらに、高相関のセンサーペアの関係を計器室担

当者にフィードバックすることで、計器室担当者の支援や技術伝承にも利用できる可能性

があることが示唆された。

2.4.4.2 提言

今回の実験結果と技術スタッフへのヒアリング結果を踏まえて、今後の外れ値検出の高

精度化、運転オペレーションへの活用に向けた提言を以下に示す。

①検出された外れ値の多くはマニュアルモードにおける人手操作を検出していた。マニ

ュアルモードと自動運転モードを区別することで検出精度を向上させる可能性がある。

②検出された外れ値の一部は、モデル事業所内部で管理されているより詳細なテキスト

(シフト間の申し送り事項等)との対応が取れることが判った。更なる文書と外れ値検出

の結果の分析とともに、検出された外れ値に対応する TAG をもとに前述の確率推論(ア

ップストリーム分析)を行い、事故の可能性を予測(シミュレーション)することで、

事故予知に関わる教育支援となるものと考える。

[参考文献]

[2.4-1] MT システムにおける技術開発 田口玄一、兼高達貮 編、日本規格協会〈品質工学

応用講座〉

[2.4-2] B. Schölkopf, A. Smola, R. Williamson, and P. L. Bartlett. New support vector

Page 82: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

69

algorithms. Neural Computation, 12, 2000, pp.1207-1245.

[2.4-3] 知の科学 サポートベクターマシン 著者:人工知能学会 編集/電力中央研究所

小野田崇 著、pp.171-188

Page 83: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

70

2.5 B2:プロセスデータ分析による傾向管理や劣化状態予測

2.5.1 廃水処理装置のプロセスデータ解析 1 「リフラックスドラム圧力残圧予測」

(1) 背景、及び目的

モデル事業所より、図 2.5-1 の分散制御システム図面 (以下、DCS 図面と記す)に示す第

2 廃水処理装置 (以下、WWT と記す)の C-3202 塔の閉塞が毎年、数回以上発生しており、

清掃~復旧までの工数も大きいとの説明が有り、この装置の解析を進めた。

図 2.5-1 DCS(分散制御システム)図面(WWT の C-3202 塔の周辺)

(2) 解析に用いたデータ

表 2.5-1 解析に用いたデータ

種類 サイズ ファイル数、件数 備考

ヒヤリハットデータ 4MB 3,297 件 期間:2006 年~2014 年

プロセスデータ 659MB 18 ファイル 期間:2006 年~2014 年

DCS 図面 2MB 10 枚

プロセスデータは、圧力、温度、流量、液面高さ、気温、分析値、演算値、予測値で構成

されており、各年、装置毎に約 120 種類を採取し、電子データの形で保管されている。

C-3202 塔

Page 84: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

71

(3) 解析方法

① プロセスデータに変化が有りそうなヒヤリハット事例の抽出

ことばネットワークを用いて、2014 年のヒヤリハットデータ全 369 件の中から、設備・

装置に異常がないヒヤリハットデータをスクリーニングし、さらに、設備・装置・プロセ

スデータを記載した WWT 関連の事例を、11 件、抽出した。そして、ヒヤリハットデータ

の記載内容を確認した結果、プロセスデータの変化を想定できる 1 件の事例を、解析対象

として抽出した。抽出した事例を表 2.5-2 に示す。

表 2.5-2 抽出した事例のヒヤリハットデータ

いつ 2014 年 8 月 24 日

勤務帯 2勤 (16:00~24:00)

どこで 計器室 (CO2 担当)

何をしていた時 WWT C-3202 清掃工事終了後、計器監視中

ヒヤリハット体験

の内容

現場担当者から PC32005(C-3202OH 系圧力)はどれ位あります

か?と聞かれたので見ると 0.08MPa あった。何故あるの?・・・

この時 C-3202 には仕切り板が OH 第一フランジに挿入され工事終

了につき外す直前だった。原因は下流の C-3203 入口弁内部から逆

流したガスによるものであった。OH の仕切り板復旧は一番最後に

して貰い、圧抜きをしてこの仕切り板の復旧をした。もしも誰も気

付かず仕切り板を緩めていたらガスが出て災害に繋がっていたと

思うとヒヤリとした。

感じた事を一言

(本人)

現場の方が気付いてくれて本当に助かりました。

考えられる対策

(本人)

内部の弁は SDM 整備にリストアップしました。SDM までの対策

として現場表示をして判る様にしておきました。

② ヒヤリハットデータと関連するプロセスデータの抽出

ヒヤリハットデータに記載のあるプロセスデータ番号は PC32005 であり、図 2.5-2 に示

す通り、DCS 図面上で、その設置場所を確認した。さらに、このデータ番号に関連するデ

ータとして、配管経路の上流側に有るプロセスデータ(P32015)を抽出した。表 2.5-3 に

各プロセスデータを説明する。

Page 85: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

72

図 2.5-2 DCS 図面上のプロセスデータ番号 PC32005

表 2.5-3 抽出したプロセスデータの説明

プロセスデータ 説明

PC32005PV D-3203 リフラックスドラム圧力の実際の値 [MPa]

PC32005MV D-3203 リフラックスドラム圧力の操作量の値 [-]

P32015PV C-3202 脱アンモニア塔の塔頂圧力の実際の値 [MPa]

PC32005 P32015

Page 86: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

73

③ プロセスデータの傾向変化の調査

ヒヤリハットデータに記載の発生日付と勤務時間帯、2014 年 8 月 24 日の 2 勤 (16:00~

24:00) の近辺のプロセスデータをグラフ化して、図 2.5-3 に示す。

図 2.5-3 プロセスデータの傾向変化

(4) 解析結果と考察

抽出したプロセスデータ PC32005PV に関して、上記グラフの通り、ヒヤリハットデー

タに記載された時間帯の中で、圧力が上昇する傾向変化を確認した。

PC32005PV は、操作量 PC32005MV が約 50%を維持した状態で、0点付近から単調増

加のモードで傾向変化しており、表 2.5-2 のヒヤリハットデータの「ヒヤリハット体験の内

容」の記載の通り、下流側の流体が逆流して入り込み、PC32005 の場所に残圧が発生して

いたと推定する。この推定内容をモデル事業所へ確認した結果、これは予期せぬ残圧発生

であったとの説明を受けた。

また、P32015 は、PC32005PV の上流側にあるが、その中間の弁を開閉することで、2

つのプロセスデータは、弁が開の場合には近い値、閉の場合には異なる値となったものと

考える。

この結果を基に、プロセスデータ PC32005PV の変化を関数近似することで、圧力

PC32005PV を監視して、圧力が上昇して危険状態となる時刻を予想して、事前に提示でき

る可能性があると考える。プロセスデータの傾向変化を基に、圧力上昇を時間の関数とし

た近似式を導出した。得られた近似式として、一次(線形)の近似式の例を図 2.5-4 に、三

次の近似式の例を図 2.5-5 に示す。

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5

2014-08-24 00:00 2014-08-24 04:48 2014-08-24 09:36 2014-08-24 14:24 2014-08-24 19:12 2014-08-25 00:00 2014-08-25 04:48

PC32005.PV_D-3203リフラックスドラム圧力[MPa]

P32015.PV_C-3202塔頂圧力[MPa]

PC32005.MV_C-3202塔頂圧力[-]

約10時間後に約0.08MPaまで上昇、

ゼロ点から単調増加のモード

[MPa]

(右軸)[ - ][MPa]

Page 87: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

74

図 2.5-4 PC32005PV 残圧発生の一次の近似式

図 2.5-5 PC32005PV 残圧発生の三次の近似式

なお、2006 年~2014 年のヒヤリハットデータとプロセスデータ PC32005PV の変化を

さらに調査したが、残圧発生という傾向変化は、上記の事例、一回のみであった。

y = 0.0077x + 0.0056

0

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0 2 4 6 8 10 12

[MPa]

time[Hr]

y = -1E-05x3 + 9E-05x2 + 0.0081x + 0.004

0

0.02

0.04

0.06

0.08

0.1

0.12

0 2 4 6 8 10 12 14 16

[MPa]

time[Hr]

Page 88: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

75

2.5.2 廃水処理装置(WWT)のプロセスデータ解析 2 「ダイレクトスチーム導入減量化検討」

(1) 背景、及び目的

モデル事業所において、WWT のC-3202 塔の閉塞による清掃から次の清掃までの間隔(清

掃間隔)を長くして、工数が大きい清掃の回数を減らす対応を実施している。C-3202 塔本

体の汚れと並行して、供給熱源である E-3205(リボイラー)にもスラッジが付着して供給

熱量が不足となり、それを補うために、ダイレクトスチームを導入している。しかし、こ

のスチーム導入の弊害として、スチーム発生のための加熱に必要な熱量が増加するととも

に、再処理の必要な廃水量が増加するため、エネルギー消費量が増大する問題が発生して

いる。

そこで、ダイレクトスチーム導入減量化の可能性を検討するため、関連するプロセスデ

ータの解析に取り組むこととした。

(2) 解析に用いたデータ

表 2.5-4 解析に用いたデータ

種類 サイズ ファイル数、件数 備考

プロセスデータ 659MB 18 ファイル 期間:2006 年~2014 年

DCS 図面 2MB 10 枚

(3) 解析方法

① 関連するプロセスデータの抽出

図 2.5-6 に示す C-3202 塔周辺の DCS 図面の中のこの塔周辺の配管経路上の 10 種以上の

プロセスデータを抽出し、グラフ化して傾向変化を確認した結果、関係ありそうな変化を

示すプロセスデータは、表 2.5-5 に説明する 5 種であった。

表 2.5-5 プロセスデータの説明

プロセスデータ 説明

FC32008PV C-3202 リボイラースチーム流量の実際の値 [t/h]

TC32001PV C-3201 フィード温度の実際の値 [℃]

M32023 C-3202 塔差圧(塔底圧 P32014-塔頂圧 P32015)の計算値 [kPa]

M32002 C-3202 塔温度差(塔底温 T32012-塔頂温 T32011)の計算値 [℃]

FC32050PV C-3202 ダイレクトスチーム流量の実際の値 [t/h]

Page 89: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

76

図 2.5-6 C-3202 塔の周辺の DCS 図面

② プロセスデータの傾向変化の調査 1

上記 5 種の 2014 年の一年間の時系列データをグラフ化して、各々の傾向変化や相互の相

関性を確認した。比較的に挙動が安定している M32023 を軸として作成したグラフを図

2.5-7 と図 2.5-8 に示す。

図 2.5-7 2014 年のプロセスデータの推移 1

M32023

FC32008PV

M32002 TC32001

FC32050PV

Page 90: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

77

図 2.5-8 2014 年のプロセスデータの推移 2

2 つの図の傾向変化とモデル事業所の情報を基に、ダイレクトスチーム流量 FC32050PV

以外の 4 種のプロセスデータの管理基準と FC32050PV との関係を確認した結果を、表

2.5-6 に示す。その結果、制御関係を検討できる可能性の有るデータは TC32001PV と

M32023 であり、ここでは、直接のデータである TC32001PV を使って、検討を進めた。

表 2.5-6 4 種のプロセスデータの FC32050PV との関係と管理基準

プロセスデータ 説明

FC32008PV 分岐した両端のため、FC32050PV の増加分だけ減少する。独立した

関係ではない。管理基準無し。

TC32001PV 温度低下時に FC32050PV を増加させて、温度を上昇させる制御関

係となる可能性有り。85℃以上で管理。

M32023 制御関係となる可能性有り。管理基準無し。2 つのデータの計算値。

M32002 ダイレクトスチーム導入時は温度変動大で、制御できない可能性有

り。2.3℃以内で管理。2 つのデータの計算値。

なお、各データが共通して 0 点に下降している 5 月、8 月、12 月に清掃が実施されてい

ること、FC32050PV は 1 月~4 月の間には 0 点近傍で推移してダイレクトスチームが導入

されなかったこと、また、M32023 と M32002 は強い正の相関が有ることを確認した。

② プロセスデータの傾向変化の調査 2

抽出したフィード温度 TC32001PV とダイレクトスチーム流量 FC32050PV の関係の詳

細を確認する。ここで、ダイレクトスチーム流量を制御の入力側とするため、ダイレクト

スチーム流量の操作量の値 FC32050MV を加えて、調査を進めた。この 3 種のプロセスデ

ータに関して、2014 年の一年間の時系列データをグラフ化して、図 2.5-9 に示す。

Page 91: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

78

図 2.5-9 プロセスデータの推移

(4) 解析結果と考察

図 2.5-9 より、TC32001PV の下降に反応して、操作量 FC32050MV が値を持ち、 流量

FC32050PV が発生して、TC32001PV の下降を抑止する制御関係にあると推定した。

さらに、解析を進めるため、プロセスデータ TC32001PV と FC32050PV とが、正の相

関関係を示す 2014 年 11 月 6 日~11 月 12 日の間を抽出し、図 2.5-10 に示す。

図 2.5-10 プロセスデータの詳細推移

この結果を基に、FC32050MV (ダイレクトスチーム流量の操作量 ) を入力、

TC32001PV(C-3201 塔フィード温度) を出力として、モデル予測制御を適用したステップ

応答モデルのグラフを図 2.5-11、モデル予測制御の入出力のグラフを図 2.5-12 に示す。

Page 92: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

79

図 2.5-11 ステップ応答モデル

図 2.5-12 モデル予測制御

この 2 つの図から、2 つのデータに関して、モデル予測制御を適用可能であることを確認

した。ここで、図 2.5-12 の入力が負の値となっているが、使用したプログラム内での出力

の目標値が「0」と設定されていたことが原因であり、実際の出力目標値 85~110℃に設定

変更した場合には入力は正の値に変わり、正常な挙動を示すものと推察する。

Time [min]

Step

resp

on

se[-

--]

Time [min]

Ou

tpu

t [-

--]

Time [min]

Inp

ut

[---

]

Page 93: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

80

2.5.3 軽油脱硫装置のプロセスデータ解析 1 「硫黄濃度管理」

(1) 背景、及び目的

モデル事業所より、軽油脱硫装置(以下、L-HT と記す) が製品の品質管理上、重要との説

明があり、次の解析対象とした。L-HT は製品の脱硫処理を行っており、製品の出荷可否を

左右するため、硫黄濃度管理は重要との説明を受けた。

L-HT の 2 つの反応塔、R-4501 と R-4502、とチャージヒーターF-4501 の周辺の DCS 図面

を図 2.5-13 に示す。

図 2.5.13 L-HT の反応塔とチャージヒーターの周辺の DCS 図面

チャージヒーター

F-4501

反応塔

R-4501

反応塔

R-4502

Page 94: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

81

(2) 解析に用いたデータ

表 2.5-7 解析に用いたデータ

種類 サイズ ファイル数、件数 備考

プロセスデータ

(L-HT 関係) 4.4GB 44 ファイル 期間:2006 年~2014 年

プロセスデータ

(TP 関係) 3.0GB 36 ファイル 同上

DCS 図面

(L-HT 関係) 4.3MB 19 枚

DCS 図面

(TP 関係) 6.8MB 35 枚

2.1 節の計器室担当者

(Operator)アンケー

ト結果データ

0.1MB 1 ファイル

ヒヤリハットデータ 4MB 3,297 件 期間:2006 年~2014 年

なお、表 2.5-7 の中の TP は、L-HT の次の工程の第 2 常圧蒸留装置の略称である。

また、2.1 節の計器室担当者(Operator)アンケート結果データを、以下、アンケートデー

タと記す。L-HT 関係のアンケートデータを図 2.5-14 に示す。

図 2.5-14 L-HT 関係のアンケートデータ(一部)

(3) 解析方法

①解析対象のプロセスデータとその関連プロセスデータの抽出

作業者№ 装置 経験年数 質問 重要度 プロセスデータ 関連プロセスデータ 理由Operator1 No.4LGO-H/T4 Q1 1 YI4561L A4501,M4530W 硫黄分管理の為

Operator1 No.4LGO-H/T4 Q1 2 YIT90 A2202,YI22002D DIST90管理の為

Operator12 No.4LGO-H/T10 Q1 1 A4501 M4530W,M4501,YI22002D 製品規格であるSを経済性を見ながら調整する為にA4501上流での性状確認する為

Operator12 No.4LGO-H/T10 Q1 2 YI4552 M4544Y,TC4503,TC4504 製品規格であるFPを調整する為

Operator12 No.4LGO-H/T10 Q1 3 YI22002D YI22002C,P2240 DLGOの蒸留,S,PPにTLGOカット温度が影響を与える為

Operator12 No.4LGO-H/T10 Q2 1 AC504 HC4508,TC4501, 加熱炉を持つ装置の基本として炉内O2の動向を確認する。状況によっては失火や異常燃焼に繋がる為

Operator12 No.4LGO-H/T10 Q2 2 PC4504A M4537,F4569 K-4501/02SUCの閉塞やロード弁の異常を早期発見する為

Operator12 No.4LGO-H/T10 Q2 3 F4563 FC4518,FC4519 RT4501フラッシングクーラー流量低下しRT停止し流量変動防止のため

Operator12 No.4LGO-H/T10 Q3 1 A4501 M4530W,M4501,YI22002D 運転変更及び外気温変化の影響確認

Operator12 No.4LGO-H/T10 Q3 2 YI4552 M4544Y,TC4503,TC4504 運転変更及び外気温変化の影響確認

Operator12 No.4LGO-H/T10 Q3 3 YI22002D YI22002C,P2240 運転変更及び外気温変化の影響確認

Operator12 No.4LGO-H/T10 Q4 1 F4563 FC4518,FC4519 RT4501フラッシングクーラー流量低下しRT停止し流量変動防止のため

Operator12 No.4LGO-H/T10 Q4 2 LC4505 T4574,PD4519 外気温変化等によりLC4505上昇しC-4502フォーミングする為

Operator14 No.4LGO-H/T22年 Q1 1 AR4501 製品規格に影響Rx触媒寿命に影響

Operator14 No.4LGO-H/T22年 Q1 2 M4544Y(DNAPYIELD) FS4544(DNAP) 製品規格(引火点)に影響

Operator14 No.4LGO-H/T22年 Q1 3 M4520T(R-4501⊿T) Rx触媒寿命に影響製品規格,生産に影響

Operator14 No.4LGO-H/T22年 Q3 1 M4520T(R-4501⊿T) Rx触媒寿命に影響製品規格,生産に影響

Operator14 No.4LGO-H/T22年 Q3 2 M4562W(R-4502⊿T) Rx触媒寿命に影響製品規格,生産に影響

Operator15 No.4LGO-H/T Q1 1 A4501 M4530W,TC4501,FC4506 リアクター温度急低下で製品である軽油のS上昇によるオフスペックがないように監視している。

Operator15 No.4LGO-H/T Q1 2 YIT90(90%)orYI4565L(95%) YI22002D(TLGO蒸留) T/P原油切替時にFEED性状で蒸留が異なる為,監視している。

Operator15 No.4LGO-H/T Q2 1 M4520T FC4507,FC4508 触媒の寿命や熱暴走が起きていないか確認。

Operator16 No.4LGO-H/T3 Q1 1 A4501 YI4561L リアクター温度調整する目安

Operator16 No.4LGO-H/T3 Q1 2 YIT90 A3502B TLGO,TKER抜出調整必要かの目安

Operator18 No.4LGO-H/T7 Q1 1 A4501 YI4516L(RQE)M4530W AR,RQE共に誤差出やすい

Operator19 No.4LGO-H/T24 Q1 1 A4501 サルファー調整

Operator2 No.4LGO-H/T3年 Q1 1 A4501 M4520W サルファー監視

Operator2 No.4LGO-H/T3年 Q3 1 A4501 M4520W サルファー監視

Operator20 No.4LGO-H/T20 Q1 1 A4501 SUL 性状安定

Operator20 No.4LGO-H/T20 Q1 2 M4530W R-4501.02WABT 触媒活性状況確認クエンチH2適正量確認

Page 95: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

82

アンケートデータから、硫黄に関係する記述が有るプロセスデータとその関連プロセス

データを抽出した。抽出したプロセスデータとその関連プロセスデータの関係と各データ

の説明を図 2.5-15 に示す。

図 2.5-15 抽出したプロセスデータと関連プロセスデータと各データの説明

図 2.5-15 の通り、プロセスデータ A4501 が頻出していたため、A4501 を軸にして、保管

データが有る 11 種の関連プロセスデータ(緑塗り部分)の 2014 年の時系列データをグラ

フ化して、各々のプロセスデータの傾向変化や相関性を確認した。その結果、プロセスデ

ータ A4501 に対して、YI4561L と M4501 は同様な挙動を示したが、他の 9 種のデータは

変化が僅かであったり、挙動が一致しなかった。同様の挙動を示した 3 種のプロセスデー

タ、A4501 と YI4561L と M4501 の 2014 年の時系列データのグラフを図 2.5-16 に示す。

図 2.5-16 プロセスデータ(A4501、YI4561L、M4501)の 2014 年の推移

②プロセスデータの傾向変化の調査

図 2.5-16 のプロセスデータの一年間の変化に対して、ヒヤリハットデータを確認し、ヒ

ヤリハット事例が発生した 9月 3日前後のデータを抽出した詳細グラフを図 2.5-17に示す。

各々のプロセスデータの傾向変化や相関性を確認した。

プロセスデータ 機能(名称) 単位 基準値 保管データ有無 関連プロセスデータ

A4501 DLGO(製品軽油)の硫黄の分析値 vol.ppm 有

M4530W,TC4501,FC4506,M4520W,M4501,YI22002D,YI4561L,YI22002,FC4502,FC4505,M4562W,T4572

YI4561L DLGO(製品軽油)の硫黄の予測値 vol.ppm 有 A4501,M4530W

M4501 H2 FEED/CHARGE比 Nm3/kL 有M4530W R-4501.4502触媒層平均温度 ℃ =<385、Max395 有 A4501M4520W R-4501触媒層平均温度 ℃ =<385、Max395 有M4562W R-4502触媒層平均温度 ℃ =<385、Max395 無

YI22002D 2TPのTLGOの90%蒸留値の予測値 ? 無YI22002C,P2240,YIT90,

A4501YI22002 各油種の性状推定の総称名称 --- 無YI22002C 2TPのTKERの95%蒸留値の予測値 ? 有YIT90 4LGOのDLGOの90%蒸留値の予測値 ? 無

TC4501 R-4501入口温度 ℃ =<356 有FC4506 E-4502A/B/C SHELL BYPASS ? 有P2240 D-2204の圧力 ? 有FC4502 CLO FEED ? 有FC4505 P-4501A/B DISCHARGE ? 有T4572 E-4503温度 ℃ 180-200 有

Page 96: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

83

図 2.5-17 プロセスデータ(A4501、YI4561L、M4501)の 2014 年 9 月 3 日前後の挙動

(4) 解析結果と考察

抽出したプロセスデータは、 A4501 (硫黄分析値、実際の値) 、YI4561L (硫黄予測値、

高度予測制御の推定値) 、M4501 (H2feed/charge、水素導入量) の 3 種である。モデル事

業所の情報では、硫黄濃度の実際の分析値 A4501 の結果が出る前に、制御装置の中で高度

予測制御を適用して予測値 Y4561L の値を算出して、各種設定に利用している。また、水

素導入量 M4501 は反応塔 R-4501、R-4502 の中で脱硫による水素消費量に依存しており、

主に塔内圧力を維持するために補充される水素量と一致するとの説明を受けた。

図 2.5-17 のグラフの右半分では、予測値 Y4561L は上昇しないが、実際の分析値 A4501

は上昇傾向にあり、予測値と実際の分析値の差が一時的に大きくなっている。この変化と

同時に、水素導入量 M4501 は減少傾向にあり、脱硫反応が減速して、硫黄濃度が上昇傾向

となる状況を示している。今後の検討課題として、脱硫での消費水素量に依存した M4501

の監視による閾値管理等を追加することにより、脱硫状態の変化を予知して、製品品質を

より安定化できる可能性が有ると考える。また、このヒヤリハット事例以外の 2014 年のヒ

ヤリハット事例の発生日前後の 3 種のデータをグラフ化して確認したが、傾向変化を確認

できなかった。

2.5.4 軽油脱硫装置(L-HT)のプロセスデータ解析 2 「ストレーナー詰まり検知」

(1) 背景、及び目的

L-HT 関連の 2012 年~2014 年のヒヤリハットデータを調査した結果、図 2.5-18 に示す

分留装置 C-4504 塔頂ラインの下流にある熱交換器 E-4509 のストレーナー詰まりが 4 回発

生していることを確認した。モデル事業所に確認したところ、1~2 ヶ月の間隔でストレー

ナー詰まり~清掃~復旧の対応を行っているという説明を受けた。そこで、プロセスデー

タを解析し、ストレーナー詰まり予測の可能性を検討した。

Page 97: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

84

図 2.5-18 4LGO の分留装置 C-4504 と熱交換器 E-4509 の周辺の DCS 図面

(2) 解析に用いたデータ

表 2.5-8 解析に用いたデータ

種類 サイズ ファイル数、件数 備考

プロセスデータ 4.4GB 44 ファイル 期間:2006 年~2014 年

DCS 図面 4.3MB 19 枚

ヒヤリハットデータ 4MB 3,297 件 期間:2006 年~2014 年

(3) 解析方法

① ヒヤリハットデータと関連するプロセスデータの抽出

ヒヤリハットデータに記載の装置とプロセスデータの設置場所をDCS図面上で確認して、

モデル事業所の情報も加えて、E-4509 熱交換器ストレーナー詰まりと関係有りそうなプロ

セスデータを抽出した。抽出したプロセスデータの場所を図 2.5-19、その説明を表 2.5-9 に

示す。

分留装置

C-4504

熱交換器

E-4509

Page 98: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

85

図 2.5-19 E-4509 熱交換器の配管経路上のプロセスデータ

表 2.5-9 抽出したプロセスデータの説明

プロセスデータ 説明

P4540PV E-4509 熱交換器上流圧力(C-4504 分留装置塔頂圧力)の実際の値

[kPa]

T4544PV E-4509 熱交換器下流温度の実際の値 [℃]

PC4507AMV D-4506 分留装置塔頂回収装置圧力の操作量の値 [---]

② プロセスデータの傾向変化の調査

抽出した 3 種のプロセスデータ、P4540PV と T4544PV と PC4507AMV の 2014 年の時

系列データのグラフを図 2.5-20 に示す。

P4540PV

T4544PV

熱交換器 E-4509 PC4507AMV

回収装置 D-4506

Page 99: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

86

図 2.5-20 P4540PV と T4544PV と PC4507AMV の 2014 年のデータ推移

(HH:ヒヤリハット)

そして、図 2.5-21 に示す通り、ヒヤリハットデータに記載の 2014 年 2 月 10 日 1 勤の時

間帯近辺のプロセスデータをグラフ化して、挙動を確認した。

図 2.5-21 2014 年 2 月 10 日 1 勤の時間帯近辺のプロセスデータの挙動

(HH:ヒヤリハット)

(4) 解析結果と考察

モデル事業所の情報より、PC4507A は分留装置塔頂回収装置 D-4506 の圧力制御用の窒

素導入弁であり、熱交換器 E-4509 にストレーナー詰まりが発生した場合、その下流にある

D-4506 に圧力低下が発生するため、一定圧力を維持するように窒素が自動導入される。

図 2.5-21 に示す通り、時刻 14:00 に E4509 ストレーナーに急な詰まりが発生して P4540

が急上昇したため、PC4507A.MV が急上昇して D-4506 に窒素を導入した後、ストレーナ

ー清掃により、詰まりが解消して、P4540 が急落したことを確認できた。

ここで、この E-4509 上流圧力 P4540PV を監視して、ストレーナー詰まりを予知するこ

とを検討した。2014 年 1 月~3 月の P4540PV のデータを基に、その統計値(平均値と標

準偏差)を用いて、傾向変化を確認したグラフを図 2.5-22 に示す。

Page 100: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

87

図 2.5-22 2014 年 1 月~3 月の P4540PV の実績値とその統計値の推移

図 2.5-22 に示す通り、平均/標準偏差の値の傾向変化を監視することにより、ストレーナ

ー詰まりを把握できる可能性が有ると考える。

この結果を基に、2014 年の一年間のプロセスデータ P4540PV の変化をグラフ化して、

ストレーナー清掃の実施日(モデル事業所の情報)を重ねたグラフを図 2.5-23 に示す。

図 2.5-23 2014 年の一年間の P4540PV の推移とストレーナー清掃実施日

図 2.5-23 に示す通り、圧力が一定期間、降下することを確認できる場合と確認が難しい

場合があった。2014 年 2 月 10 日の場合には、ストレーナー清掃後、P4540PV は、1 ヶ月

程度 、緩やかな上昇であったが、他の清掃日時では、清掃直後に元の高い値に戻っている

場合もあった。従って、ストレーナー詰まりを予知するためには、P4540PV の監視以外に、

他の項目を加える必要があるものと考える。

また、モデル事業所の情報によると、ほとんど毎回、ストレーナーだけが詰まるのでは

なく、その上流の配管経路全体が閉塞状態となっているため、管内に堆積したスラッジを

完全には除去できない場合も発生しているようである。そのため、復旧直後に P4540PV が

Page 101: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

88

急上昇する可能性もあり、清掃状態の良し悪しの影響も考えられる。他の影響を含めて、

今後、更なる検討が必要と考える。

2.5.5 アイソシーブ装置のプロセスデータ解析 「制御弁ポジショナーの作動不良検知」

(1) 背景・目的

アイソシーブ装置(以下、IS と記す。)において、2014 年 1 月 30 日の 1 勤の時間帯に発

生したヒヤリハットデータの内容を確認した結果、プロセスデータが変化している可能性

が高いと判断し、解析に着手した。関係する装置やプロセスデータを記載した DCS 図面を

図 2.5-24 に示す。

図 2.5-24 ヒヤリハット発生に関係する DCS 図面

(2) 解析に用いたデータ

表 2.5-10 解析に用いたデータ

種類 サイズ ファイル数、件数 備考

プロセスデータ 2.75GB 18 ファイル 期間:2006 年~2014 年

DCS 図面 4.2MB 22 枚

ヒヤリハットデータ 4MB 3,297 件 期間:2006 年~2014 年

サージドラム D-1311 PC1303PV

PC1311PV/MV

PC1304PV/MV

Page 102: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

89

(3) 解析方法

①ヒヤリハットデータとプロセスデータの抽出

ヒヤリハットデータの内容は以下の通りであった。

「計器室ボード監視中、FC1311PV(サージドラム D-1311 i-P 出口流量計の実際の値)の下

限アラームが発報した。通常、ハンチングしている流量計だが、トレンドを確認するとハ

ンチング幅が大きくなっていた。・・・(中略)・・・取り敢えず、FC1311MV(D-1311 i-P

出口流量計の弁開度操作量)を確認した結果、86 に対して、制御弁ポジショナーの開度は

約 80%だったため、FC1311MV を 85 に下げた所、制御弁ポジショナーの開度は約 60%ま

で下がった。これはポジショナーの不良と判断し、計装担当者へ依頼し、パイロットリレ

ーと制御弁ポジショナーを交換し、復旧した。」

ヒヤリハットデータの内容と図 2.5-24 の DCS 図面を基に、関連するプロセスデータを抽

出し、その説明を表 2.5-11 に示す。

表 2.5-11 抽出したプロセスデータの説明

プロセスデータ 説明

FC1311PV D-1311 サージドラム i-P 出口流量計の実際の値 [Nm3/h]

FC1311MV D-1311 サージドラム i-P 出口流量計の制御弁の操作量の値 [---]

PC1303PV D-1311 サージドラム入口圧力計の実際の値 [MPa]

PC1304PV D-1311 サージドラム出口圧力計の実際の値 [MPa]

PC1304MV D-1311 サージドラム出口圧力計の制御弁の操作量の値 [---]

① ヒヤリハット発生時のプロセスデータの挙動調査

ヒヤリハット発生日時とその前後1日に亘る各プロセスデータの挙動を確認した。図

2.5-25 にヒヤリハットデータに記載された FC1311PV と FC1311MV の挙動を示す。上の

グラフは FC1311PV の変動を、下のグラフは FC1311MV の変動を示す。2 つのグラフの中

央付近の 2 本の赤線の間の領域はヒヤリハット発生した一勤の時間帯である。図より、領

域前半で FC1311PV のハンチング幅は急に大きくなってゼロ点付近まで急降下しており、

ヒヤリハットデータの下限アラーム発報を示し、領域中央では FC1311MV が 0 点付近まで

減少しても FC1311PV はほとんど変化しないため、制御弁ポジショナーの異常を示すこと

を確認した。

Page 103: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

90

図 2.5-25 ヒヤリハット発生時の FC1311PV と FC1311MV の挙動

② プロセスデータからのヒヤリハット検出可能性の検討

経路内の圧力が一定の場合、流量 FC1311PV は弁開度FC1311MV に比例することより、

2 つのベクトルの時間相関係数を、ヒヤリハット検出指標として利用することを検討した。

指標 KPI(t)(Key Performance Indicator)を以下の式で表す。

KPI(t) = cor(PVt−T+1:t,𝑀𝑉𝑡−𝑇+1:𝑡)

ここで、t は離散時間のインデックス、cor は 2 つベクトルの相関係数を計算する関数、変

数の添え字 a:b は時区間 a,…,b における当該変数値を並べたベクトルを構成する表記、T

は相関係数の観測時間である。

観測時間 T=128(1 日分の長さ)場合の KPI(t)の算出結果を図 2.5-26 に示す。上のグラ

フ(a)はヒヤリハット発生日時とその前後 1 日の結果、下のグラフ(b)はヒヤリハット発生日

時の前後 14 日の結果を示す。前述と同様に、2 つのグラフの中央付近の 2 本の赤線の間の

領域はヒヤリハット発生した一勤の時間帯である。グラフ(a)より、領域の開始時点から相

関係数 KPI(t)は低下を始めており、制御弁異常を監視する指標としての可能性を確認した。

一方、グラフ(b)より、相関係数 KPI(t)が低下する状況はこの約 28 日間に何度も発生してお

KPI(t)

KPI(t)

(a) 短期 (57hr)

(b) 長期 (約28日)

[--]

[--]

Page 104: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

91

り、制御弁異常以外のいくつかの要因が関係しているものと推定する。この要因としては

何点か考えられるが、一例として、プラント状態が大きく変動する場合などには対象経路

内の圧力が一定の前提が成立しなくなるため、FC1311PV と FC1311MV の関係が非線形と

なり、相関係数を低下させる可能性が有ると考える。また、相関係数を長期に算出する場

合、必然的に多くのプラントの状態変動も取り込まれてしまうため、相関係数低下の要因

と成り得ると考える。実用化のためには、サンプリングレートを高くして、圧力が一定と

見なせる期間に多くのデータを採取して相関係数を算出する、あるいはプラントの運転状

況が静定の時に相関係数を算出するなど、更なる検討が必要と考える。

図 2.5-26 ヒヤリハット発生時区間前後の KPI(t)の動き

KPI(t)

KPI(t)

(b) 短期 (57hr)

(a) 長期 (約28日)

[--]

[--]

Page 105: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

92

2.5.6 考察・まとめ

(1) 廃水処理装置の圧力監視と関数近似による残圧発生予測の可能性を確認した。

(2) 廃水処理装置の流体温度を監視し、蒸気量を制御するモデル予測の可能性を確認した。

(3) 軽油脱硫装置の硫黄濃度と水素導入量の監視による脱硫状態の変化検知の可能性を確

認した。

(4) 軽油脱硫装置のストレーナー詰まりを上流圧力の標準偏差値の監視による検知の可能

性を確認した。

(5) アイソシーブ装置の制御弁ポジショナーの作動不良を制御弁の流量と操作量の相関係

数の監視による検知の可能性を確認した。

2.5.7 課題・提言

(1) 今回、解析した 3 つの装置以外の未着手の装置のデータ解析を行い、設備劣化や事故発

生の予測・検知の可能性の有る事例を蓄積する必要が有る。

(2) 抽出した予測・検知の可能性の有る事例に関して、更なる解析や検討により、可能性精

度を向上させるとともに、実験により抑止効果の可能性を検証することが適当と考える。

(3) 将来的には、ヒヤリハット発生日時と符合するプロセスデータ解析システム(自動化)

を開発することが望まれる。

Page 106: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

93

テキストマイニング

データマイニングベイジアンネット

ビッグデータ解析

ソフト開発環境

解析モジュール 解析結果等ファイリングモジュール

フォルダー

フォルダー

フォルダー

ビッグデータモジュール

ヒヤリハット報告

プロセスデータ

A B N

高 ← 公開基準レベル → 低

・・・・・・・・

クラウドシステム

鳥取大学 再委託企業 モデル事業所

2.6 Ⅱ:ビッグデータの情報処理後の情報共有の有効性の調査研究

2.6.1 プラットフォームの試作と展開

2.6.1.1 プラットフォームの試作結果と考察

プラットフォームのプロトタイプを試作した。プロトタイプの概要を図 2.6.1 に示す。ク

ラウド上のプロトタイプは、3 つのモジュールで構成される。「解析モジュール」では、デ

ータマイニング、テキストマイニング、ベイジアンネットなどのデータサイエンスソフト

が集約され、【Ⅰ】を達成するための効率的な解析機能が鳥取大学と再委託企業で共有され

る。「ビッグデータモジュール」には、モデル事業所の情報・データがセキュアな状態で蓄

積され、鳥取大学と再委託企業のみで共有される。

図 2.6-1 プラットフォームの試作

ファイリングモジュールでは、公開のメリット・デメリット、あるいはインセンティブ

を考慮した上で、テーマ【Ⅰ】で開発された技術や知見について公開レベルごとに分類す

る実験を行った。

ここでは、【Ⅰ】で開発される技術とは「データと情報やその分析結果」とする。また、

公開する事の是非は、「メリット/デメリット」、「リスク/リターン」、 あるいは「価値と

インセンティブ 」などで決定される。また、公開を許可する範囲 (レベル設定)「社内の

み(社外秘) 」、「同業他社」、「特定の相手のみ(部外秘)」、あるいは「HP に掲載してよ

い」などが考えられる。モデル事業所が、テーマごとに、公開レベルの分類による公開性

を評価した結果を以下の表 2.6-1 に示す。ここで、「相互交換」とは、秘密保持契約を結ん

だ状態で相互に情報を交換できる事を意味する。

Page 107: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

94

表 2.6-1 公開レベルの分類・仕分けの結果、および各技術の公開性評価

(HH:ヒヤリハット)

テーマ【Ⅰ】の活動、プラットフォームの試作、および、表 2.6-1 に示す公開性の評価

は初めての試みであり、この結果から、以下の考察がなされる。

(1)従来、業界では、事故に関わる情報の公開には消極的であり、事業所間や業界全体

で共有されることがなかった。このため、過去の反省が活かされず、類似の事故が起こっ

ていた。

(2)この度【Ⅰ】の調査研究により、以下の結果を得た。

1)ヒヤリハット文章の構造化と原因現象の簡易探索技術(A1)は、モデル事業所より「有

効性有り」との評価を受け、実用化による技術スタッフへの注意喚起や教育効果が期待

される。

2)ヒヤリハット・理論オントロジーの結合と確率推論による事故発生の予測(A2)は、

モデル事業所より「有効性有り」との評価を受け、技術スタッフへの予兆検出やその気

付きが期待される。

3)また、プロセスデータの外れ値(異常)検知(B1)とプロセスデータ分析による傾向

管理や劣化状予測(B2)は、モデル事業所より、プロセス変動やリスクのリアルタイム

把握が期待される。これらの成果はプラットフォームに内在されている。

(3)そこで、モデル事業所では、本調査研究の結果を有効と考えるとともに、表 2.6-1 に

示すように、特定の会員で「相互交換」を了解できる相手には、多くの技術やその結果を

公開できると考えている。

(4)この理由について考察する。

相互交換 相互交換

マスク付きHH ○ △ ○ ×

マスク付きプロセスデータ ○ △ ○ ×

HH → 自動データベース化技術

エクセル化データベース ○ ○ △ ○ × 有効性評価と同様

クラウドシステム

構造化技術

構造化結果 ○ ○ △ ○ × 有効性評価と同様

アノ―テーション技術

アノ―テーション結果 ○ ○ △ ○ × 有効性評価と同様

原因現象 簡易探索システム

探索システムから得られる知識 ○ ○ △ ○ × 有効性評価と同様

理論オントロジ―知識 ○ ○ △ ○ × 有効性評価と同様

理論/HH結合技術(学習)

HH/設備・装置TAG結合技術

理論/HH/設備・装置TAG結合DB ○ ○ △ ○ × 有効性評価と同様

確率推論技術(ベイジアンネット) ○ ○ △ ○ × 有効性評価と同様

確率推論結果 ○ ○ △ ○ × 有効性評価と同様

外れ値検出技術(One Class SVM)

外れ値検出結果 ○ ○ △ ○ × 有効性評価と同様

傾向予測・管理技術

傾向予測・管理結果 △ ○ △ ○ × 有効性評価と同様

プロセス変動結果 △ ○ △ ○ × 有効性評価と同様

基本データ

公開レベル

インセンティブとなるか?

F

技術・データ分類・テーマ社内のみ

(他事業所)他社

(同業)特定

(会員)一般HP

有効性評価

A

A1

A2

B1

B2

Page 108: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

95

1)本研究を更に発展させることで、他事業所(他社)が本調査研究【Ⅰ】を行えば、プ

ラットフォームにおける情報交換によって当該技術に関する他社のレベルを知ることが

でき、自社技術と比較する事から、それが切磋琢磨の一助となる。

2)さらには、自社のデータのみの解析には限界があることから、他社データを含めたデ

ータ解析を行う事で、共通性の高い類似事故の防止にも繋がり、業界全体のメリットとも

なる。

次に、プラットフォ―ムに関わる今後の展開を考える。

(1)自主防災のイノベーション達成には、本調査研究によるプラットフォームを発展さ

せて事故の予測と対策技術を発展させ、それを共有する事業者が増加する、というスパイ

ラルアップが必要である。

(2)そのためには、更なる技術開発とともに、参加事業者を増やす活動が必要である。

(3)技術開発を継続・進化させるためには、大学や研究機関、あるいはプラントメーカ

ーなど、多様なメンバーがプラットフォーム内のデータを広く共有できる環境の整備が必

要である。この事については、詳細を次項に示す。

(4)また、参加事業者を増やすには、それを加速するためのインセンティブが有効と考

える。この事については、後述する。

(5)さらには、他事業所を訪問し、本調査研究の活動成果を PR する事も一考と考える。

(6)これらについては、今後とも継続して課題の調査・検討の必要がある。

2.6.1.2 プラットフォームの発展と展開

本調査研究による解析結果は一定の条件下(相互交換)で共有できることから、ここで

試作したプロットフォームを起点として、事業所間や業界全体で共有できる可能性を示唆

している。これを展開するには、プラットフォームに他事業所のデータや情報を収集する

とともに、テーマ【Ⅰ】の技術の進化によって、より共有することの価値を高める事がで

きると考えられる。また、事故の分析や予測技術の向上には、大学などの研究機関やプラ

ントメーカーがプラットフォーム内の情報を共有し、研究開発する事も有効である。

業界全体、大学やプラントメーカーが参加するプラットフォーム展開イメージを図 2.6-2

に示す。

プラットフォームにおけるビッグデータ解析基盤の機能の進化、および活用フローとし

ては、以下となる。

(1)石油化学プラントを保有する各事業者からの運用データ(DCS データ、ヒヤリハッ

ト、など)の収集、蓄積

(2)大学・研究機関、あるいはプラントメーカーの参加による技術の開発と進化

(3)各事業者単位のデータ解析、および解析結果の事業者へのフィードバック

(4)各事業者の解析結果を集約し、事業者間での横断的展開

Page 109: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

96

図 2.6-2 プラットフォームの展開イメージ

上記を実現するために、プラットフォームに求められる要件としては、以下が挙げられる。

(A)データ保護機構

今回示したように、ビッグデータ解析を事業者内に閉じず、アウトソースすることは解

析手法を進化させるために重要であるが、一方で日々の操業に関わるデータを事業者から

外部へ出すことについては、経営情報や製造ノウハウの漏洩の懸念から、抵抗がある。事

業者からデータを集めるには、他者へのデータ開示や漏洩を防止する必要があり、そのた

めのデータの更なる保護機構が必要である。

(B)多様な解析サービサの参加

ビッグデータの解析手法は数理科学や人工知能などの活用により今後も日々進化すると

考えられ、この様な進化を積極的に活用するために多様な解析サービスを行う事業者(解

析サービサ)がビッグデータ解析基盤に参加することが求められる。

(C)事業者保有データのフィルタリング/意味づけ

多様な解析サービサのビッグデータ解析基盤への参加を促すためには、解析対象となる

データの「意味」を把握することが重要である。この様な解析サービサと事業者の手間を

極力省く必要があり、そのために各事業者からのデータの適切なフィルタリングや意味づ

けなどが必要となる。

(D)各事業者における解析結果の匿名化

各事業者における解析結果を業界内で共有し、業界内で生じている様々な想定外事象の

プラントメーカー

大学研究機関

他事業所への展開・・・・

技術の開発と進化

Page 110: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

97

原因やこれに関する予兆を各事業者に対しフィードバックすることは重要である。一方で、

この様な詳細情報の共有に関しては、運用状況やノウハウの開示につながることから各事

業者の抵抗が大きいと予想される。そこで、解析結果の真意は残しつつ、プロトタイプの

構成で示したように、情報公開には条件を設定する。

2.6.2 インセンティブに関する考察と提言

2.6.2.1 手法

(Ⅱ1) 事業所へのヒアリングにより、情報公開に伴うデメリット、現状の情報共有により

得られる知見と課題について調査する。

(Ⅱ2) テーマ I によって得られた結果を踏まえ、ビッグデータ解析で得られるであろう事

業所視点でのインセンティブの明確化を行う。

上記を進めるにあたって、課題を整理するためのフレームワークを策定する必要がある。

検討の結果、主たるステークホルダである事業者などの「内部 KPI」(Key Performance

Indicator) 、および「内部プロセス」を見える化するためのツールとして、

NEXPERIENCE/BA を活用することとした。NEXPERIENCE/BA は、システムダイナミ

クスをベースとした事業課題分析のための手法である。NEXPERIENCE/BA では,経営や

業務データを顧客から入手し,因果ループ図(CLD:Causal Loop Diagram)と呼ばれる

特定のモデリング表記法により可視化して,その構造の形状から起こり得る挙動を推測し、

顧客の合意を得ながら課題を特定するというプロセスを踏む。ビジネス構造 CLD は、経営

指標や業務指標、それらに影響を及ぼす影響要因をノード、また、それらのノード間の因

果をリンクで表す有向グラフネットワークである。図 2.6-3 に簡単な CLD の例を示す。

図 2.6-3 因果ループ(CLD: Casual Loop Diagram)例

例えば、受注が増大すると業務活動量が増加し、これにより経験値が増加し、成果に繋

がる。これが更なる受注の増大に繋がるという様な正の相関の連鎖、すなわち、拡張ルー

Page 111: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

98

プを構成する。一方で、業務活動量が増えると、人や設備の疲労度が増し、これにより成

果が減るという様な逆の相関も考えられ、この場合にはバランスループとなり全体として

収束方向に向かう。この様な因果を分析することで、組織の挙動や特性を把握することが

できる。手法の詳細については、参考文献[2.6.1]を参照されたい。

NEXPERIENCE/BA を用いたテーマ II の進め方を以下に示す。

<ステップ1>

保安業務に関わる、ステークホルダ(事業者)の内部 KPI やプロセスを

NEXPERIENCE/BA により見える化し、現在の課題に関して整理する。

<ステップ2>

テーマ I の結果を元に、プラットフォームにおけるビッグデータ解析による効果、およ

び、事業所間のインセンティブの明確化を行う。

2.6.2.2 ステップ1:現状課題整理

現状課題の整理のために、以下の活動を行った。

・モデル事業所見学: 2015/9/8

・CLD 仮説立案

・ヒアリング(モデル事業所): 2015/11/17

・リバイズ版 CLD レビュー: 2015/12/14

ヒアリングにより得られた CLD を図 2.6-4 に示す。尚、図におけるオレンジ色のノード

が財務系の KPI(Key Performance Indicator)、緑色のノードが業務系の KPI あるいは影響

要因、青色がヒト系の KPI あるいは影響要因である。各ノードは有向線で結ばれているが、

実線が正の因果関係、点線が逆の因果関係を示す。

Page 112: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

99

図 2.6-4 現在の保安業務に関わる因果ループ図(CLD)

(1)事業者側の課題分析結果を以下に示す。

事業者側にとっては利益を最大化することが最終ゴールであり、このために売上増とコ

スト低減を図る必要がある。売上増のためには出荷量を増やす必要があるが、重大事故が

生じると、設備稼働時間が減り、出荷量が減る。また、事業者にとっては定期的に設備停

止を伴う検査が必要であり、この停止により稼働時間が低下し、出荷量が減る。停止を伴

う検査は、認定事業者に認定されることで頻度を減らすことができるが、重大事故が生じ

ると、認定も取り消される可能性があり、事故以降の稼働時間も減少することになるため、

さらに売上への影響が大きくなる。

Page 113: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

100

事業者の現場側には、技術スタッフ、計器室担当者、設備運転員の3レイヤが存在する。

技術スタッフとは、計器室担当者の上位に位置し、設備投資や全体の運転/運用の計画立

案を図るメンバーである。計器室担当者は、設備運転状況を監視センタ(統合計器室)に

て SCADA(Supervisory Control And Data Acquisition)画面を通じてモニタリングし、

適切な運転指示を与えると共に、異常が生じた場合の対処を行う。設備運転員は、現場設

備を定期的に巡回し、現場に置かれた計器のチェックや設備状況の目視チェックを行う。

現場で異常が発生した場合は、計器室担当者に報告し、適切な対処を行う。計器室担当者

と設備運転員はチームで行動し、一日3交替制(または2交替制)で入れ替わる。

重大事故を低減するには、①稼動する設備状況の的確な把握、②設備における異常状態

の早期摘出、③異常状態により生じる想定外事象への適切な対処、④異常状態を今後生じ

させないような適切な投資、が必要である。これらを行うためには、技術スタッフ(上記

④へ対応)、計器室担当者(上記①②③へ対応)、設備運転員(上記①②③へ対応)におけ

る「熟練度」を上げることが重要である。

想定外事象が生じると、これに対応するための様々な取り組みが組織的な経験値になり、

現場の熟練度は向上すると考えられる。また危険予知やヒヤリハット報告の実施により、

日々の注意力が向上し、これを共有することで、技術スタッフ、計器室担当者、設備運転

員の「熟練度」を上げることが期待できる。

ただし、想定外事象への対応やヒヤリハットの共有は一過性のものであり、さらに、こ

の様な記録はファイルとして保管されているのが一般的である。したがって、この蓄積が

進んだからといって、組織的な熟練度が向上するという正の関係は存在しない。過去の蓄

積を横断的・網羅的に解析し、形式知化することができれば、日々の保守/運用の質が向上

し、重大事故の発生を抑えることが期待される。しかしながら、事業者側では、ヒヤリハ

ットなどのテキストデータを網羅的に解析できるようなスキルを持つような事業者は極め

て限られると考えられる。モデル事業者へのヒアリングを行った際も、過去のヒヤリハッ

トをベースとした PDCA の不足について言及があった。また、運転状態を表す SCADA や

DCS(distributed control system)からのデータ分析についても、監視すべきデータセットの

選択については、各計器室担当者に委ねられており、様々な DCS からのデータを統計的に

網羅的に解析し、日々の運転に活かすような取組みも限られている。

現場の熟練度が向上すると、基本的には想定外事象は減ると考えられる。一方で想定外

事象が減ると、中長期的には経験が風化することで組織としての対応力が下がり、思わぬ

ところで重大事故を惹起する可能性がある。したがって、想定外事象の共有頻度を上げる

ことが必要であるが、一事業所内、あるいは一企業内で情報が閉じている限り、この様な

共有頻度を上げることは困難である。

(2)事業者側の視点からは以下が考察される。

・想定外事象やヒヤリハットの蓄積により、技術スタッフ、計器室担当者、設備運転員の

「熟練度」を上げることができれば、日々の保守/運用の質が向上し、重大事故の発生を

Page 114: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

101

抑えることが期待される。

・しかしながら、日々蓄積される現場情報を横断的・網羅的に解析し、熟練度を向上させ

るための情報利活用スキルが不足している。

・さらに、一事業者内、あるいは一企業内での想定外事象の数は少ないため、なかなか熟

練度を向上させることは困難。

2.6.2.3 ステップ2:インセンティブ明確化

事業者側視点でのインセンティブについて検討を行った。本検討のために、テーマ I で実

施したビッグデータ解析の有効性と、保守/保全のプロセスのマトリクスで整理する。

まずテーマ I では、図 2.6-5(前述、P.34 の「図 2.3-1 データの結合」と同じ)に示すよ

うに、ヒヤリハットデータやプロセスデータ単体の解析で得られる結果と、理論オントロ

ジーを加えた各データの紐付けを行い、ベイジアンネットワークを活用した確率推論で得

られる結果があり、それぞれ以下のような情報が得られ、事業者のとインセンティブに繋

がると考えている。

必要となる資源:予知技術、診断技術、固有技術、体制のマネジメント

図 2.6-5 ビッグデータ解析概念図 (HH:ヒヤリハット)

Page 115: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

102

(A1)ヒヤリハット分析により、原因/対策候補を提示することで、過去の振り返りや新た

な事象への対応に繋げることができる。

(A2) ヒヤリハットの分析、理論モデルとの体系化により、知識間の関連を予測(確率推

論)し、その情報提示して事故の予兆や対策に関わる気付きを与える。

(B1)プロセスデータから通常運転と異なる例外(異常)状態の発生を識別し、その情報

を提示することで事故に繋がる予兆を与える。

(B2)プロセスデータの解析から設備や制御系の時間変化を推定し、設備の劣化やプロセ

スの変化を予測

事業者における保守/保全プロセスについては、そのあるべき姿について論じている「経

営のための保全学」(木村好次著)[参考文献 2.6.2]を参考にした。同書では、戦略的マネ

ジメントシステム(MOSMS:Maintenance Optimum Strategic Management System)

を提唱している。MOSMS は「PDCA サイクルをスムーズに回し続け、さらに質の高い保

全にスパイラルアップして行く」ことを目的としており、具体的には以下のステップで実

施することをめざしている。

(1)Plan:保全計画

必要となる資源:新保全方式

(2)Do:実行プログラム

(3)Check:評価プログラム

必要となる資源:評価技術

(4)Action:反映プログラム

必要となる資源:データマネジメント

(5)PDCA が回り続けるために

必要となる資源:危機管理システム、教育システム

(6)進化プログラム(スパイラルアップのために)

必要となる資源:改善技術、MP 設計

上述したビッグデータの有効性と保全のプロセスとをマトリクスで整理し、各プロセス

においてビッグデータのユースケースをまとめたものが表 2.6-2 である。尚、ユースケース

の検討においては、テーマ I でめざしたビッグデ-タ解析の有効性がほぼ達成されたことを

前提としている。

Page 116: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

103

Do(実行時)におけるビッグデータの活用としては、定常的な運営時のプロセス監視と、

想定外事象が生じた場合での利用が考えられる。プロセス監視時においては、B1、B2 で得

られた知見により、異常状態を早期に検知し、事前に対応できる。想定外事象発生時にお

いては、A1 によって得られる類似事例検索により迅速な対応や横展開が図れると共に、A2

によって得られる理論オントロジーとの組合せにより、危険度の評価を行うことが出来、

より適切な対応をとることができる。

また、想定外事象発生時のプロセスデータを詳細に解析することで、異常状態の更なる

解析を行うことが出来、適切な対応に繋げることができる。

保全の Check(評価時)においては、リスクアセスメントへの適用が考えられる。A2 で

得られる理論オントロジーとの組合せにより、理論的に危険度の高い項目と過去に生じた

ヒヤリハットとの確率推論を行うダウンストリーム解析により、危険ポテンシャルの把握

とそのリスクについて評価を行うことが出来る。

保全の Action(反映)においては、B1 や B2 から得られた知見をベースに監視すべき TAG

データの見直しや前処理方法のブラッシュアップが考えられる。また A2 で得られた理論オ

ントロジーとの組合せによる監視対象 TAG の見直しも有効と考えられる。また、A1 で得

られるヒヤリハットデータベースの蓄積による効果をアピールすることで、日々のヒヤリ

アップストリーム/ダウンストリーム解析により、理論的な危険

技術

スタッフ

技術

スタッフ

計器室担

当者、設

備運転員

計器室担

当者、設

備運転員

表 2.6-2 ビッグデータ解析ユースケース(仮説)

Page 117: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

104

ハットあるいは危険予知にフィードバックし、より良いヒヤリハットカードの記載につな

げることができる。この様な活動がデータマネジメントの高度化につながると期待される。

MOSMS においては、PDCA のループが継続的に回り、さらに手法が進化することを求

めている。PDCA を継続的に回すためには教育が重要なファクタであるが、A1 や A2 で得

られた理論的背景とヒヤリハットの蓄積を提示し、教育資料として整備することで、日々

の保守/保全業務の「意味づけ」に寄与すると考えられる。また、PDCA を更に進化させ

るためには、手法の改善が必要であるが、この様なビッグデータ解析をアウトソースし、

様々なプレーヤーが参加することで、解析手法や理論モデルとの体系付け手法がブラッシ

ュアップされ、新たな気づきや予測の提示が可能になると考えられる。

図 2.6-6 にインセンティブ(仮設)のまとめを示す。計器室担当者、設備運転員の日々の

活動が DCS ログやヒヤリハットなどの形で記録され、これがビッグデータ解析基盤により

様々な分析を行うことで、上記に述べたようなユースケースが実現される。この成果を技

術スタッフ、計器室担当者、設備運転員にフィードバックすることで、監視や点検のレベ

ルアップが図れ、想定外事象が生じた際の対応力も向上すると期待される。この蓄積によ

りそれぞれのレベルで「熟練度」が向上し、この PDCA が継続的かつスパイラル的に回る

ことで、自主保安力が向上することが期待される。

Page 118: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

105

図 2.6-6 ビッグデータ解析による事業者インセンティブ(仮説)

上記インセンティブを踏まえ、事業者、およびビッグデータ解析基盤における因果ルー

プ図(CLD)を図 2.6-7 に示す。DCS データやヒヤリハットの解析結果が最終的に技術ス

タッフ、計器室担当者、設備運転員にフィードバックされることで、各レイヤの熟練度の

ループがより強固になることが分かる。また、一事業者だけではなく、複数の事業者から

の現場データを集積し、共有することが可能になれば、検査の質向上に反映できる。

計器室担当者

設備運転員

Page 119: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

106

2.6.2.4 考察

モデル事業者へのヒアリング結果を見える化/分析した結果、事業者側としては、想定

外事象やヒヤリハットの蓄積により、技術スタッフ、計器室担当者、設備運転員の「熟練

図 2.6-7 ビッグデータ解析基盤導入後の因果ループ図(CLD)

Page 120: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

107

度」を上げることができれば、日々の保守/運用の質が向上し、重大事故の発生を抑えるこ

とが期待されるが、これを実現するための情報利活用スキルが不足しており、さらに、一

事業者内での想定外事象の数は少ないため、なかなか熟練度を向上させるのは困難である。

上記を解決するために事業者の保有するビッグデータの解析を行い、保守保安業務に活

用することが重要となるが、そのインセンティブとしては、①定常運転時の異常早期把握、

②想定外事象発生時の類似事例把握および危険度把握、③リスクアセスメント時における

理論と過去事例に基づく定量的リスク分析、④過去事例や背景情報の体系化による教育レ

ベル向上、などが挙げられる。

これを実現するためのビッグデータ解析基盤の機能としては、(1)石油化学プラントを

保有する各事業者からの運用データ(DCS データ、ヒヤリハット、など)の収集/蓄積、

(2)各事業者単位のデータ解析および解析結果の事業者へのフィードバック、

(3)各事業者の解析結果を集約し、事業者間での横断的解析。解析結果の蓄積が必要と

なる。

2.6.2.5 課題

今回提言したビッグデータ解析基盤は以下の4項目を目指しており、本活動により、基本

的な技術開発を行い、一定の評価を得た。

(A1)ヒヤリハット分析により、原因/対策候補を提示することで、過去の振り返りや新た

な事象への対応に繋げることができる。

(A2) ヒヤリハットの分析、理論モデルとの体系化により、知識間の関連を予測(確率推

論)し、その情報提示して事故の予兆や対策に関わる気付きを与える。

(B1)プロセスデータから通常運転と異なる例外(異常)状態の発生を識別し、その情報

を提示することで事故に繋がる予兆を与える。

(B2)プロセスデータの解析から設備や制御系の時間変化を推定し、設備の劣化やプロセ

スの変化を予測

これらを実現するためには、本調査研究で実施したビッグデータ解析手法の更なるブラ

ッシュアップが必要である。以下のブラッシュアップの方向性が考えられる。

① 理論オントロジーとヒヤリハット-DCS データ(TAG)間の「紐付け」手法の確立:

今回の調査研究においては、理論オントロジーとヒヤリハットのヒューマンファクタ部

分のみの紐付けを行ったが、テーマⅠ-A1 で実施したテキストマイニングの結果得られてい

るヒヤリハットの原因や対策などとは紐付けられていない。この部分の紐付けができると、

さらに確率推論によるダウンストリーム/アップストリーム解析の質向上が期待できる。

また、今回のテーマ I-B1 および B2 においては、ヒヤリハットを活用して TAG や DCS デ

ータの絞込みを行い、詳細解析を行っているが、テーマ I-A2 で構築したベイジアンネット

のような関連付け/紐付けは実施できていない。図 2.6-5 に示したような体系を構築するこ

とで、より高度な解析が可能となる。

Page 121: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

108

② 紐付け手法の一般化およびビッグデータへの対応

今回のテーマⅠ-A2 で実施した理論オントロジーとヒヤリハット/ヒューマンファクタ

との紐付けは、その分野の専門家が人手で実施しているため、分析する対象範囲が限られ

ている。この紐付け手法のアルゴリズムを抽出し、全てのデータへ適用できるようビッグ

データ対応を行う必要がある。さらに上記①②の紐付け手法についても同様にビッグデー

タ対応にすることが望ましい。

③紐付けされたデータの解析手法

2.6.2.3 項において事業者のインセンティブ分析で示したように、データ解析のタイミン

グ、および対象者は活用するフェーズによって異なる。今回の調査研究においては、この

様なユースケースに基づく解析手法の提案という観点では、まだ不足している面があるた

め、今後、①②で得られる紐付けされたデータに対し、異なる視点や状況に応じた解析手

法の検討が求められる。

④事故予測や対策立案の知的支援と IoT 展開の提案

今年度の A2 では、分析結果を人が見て予兆する。重大事故の予測や対応には、人による

詳細な分析あるが有効である。一方、比較的軽微な事故対応については、マルチエージェ

ントと分散問題解決(DPS: Distributed Problem Solving )で構成される推論システムと

I-B1 と B2 の自動化による TAG のオンライン変動で構成される IoT による事故発生のリア

ルタイム予測と早期対応策立案支援が提案できる。

ビッグデータ解析基盤の構築に関しては、今回、解析に必要となる最小限のプロトタイ

プ構築に留まっているため、今後、実運用を見据えた検討が必要である。検討項目として

は、2.6.1.2 項で述べた要件、すなわち、(A)各事業者のデータ保護、(B)多様な解析サービ

サの参加、(C)事業者保有データのフィルタリング/意味づけ、(D)各事業者における解析結

果の匿名化、のさらなる検討が必要である。

今回の調査研究では、一モデル事業者を対象に実施しているが、これを業界全体に拡げ

てはじめてビッグデータ解析基盤が「プラットフォーム」としての価値を持つ。そのため

には、業界の多数の事業者に参加を促すような、規制緩和などの外部インセンティブが必

要である。この様な制度設計とビッグデータ解析基盤のあり方について、関係するステー

クホルダ間のさらなる検討が求められる。

[参考文献]

[2.6-1] 長岡、他:「ヒトと経営の視点からの顧客価値可視化手法の開発」、日立評論 Vol.97

No.11 664–665、2015 年 11 月

[2.6-2] 木村、他: 「経営のための保全学 戦略的保全マネジメントシステム(MOSMS)

の提案」、社団法人日本プラントメンテナンス協会、2006 年 7 月

(https://www.jipm.or.jp/data/120423_1.pdf)

Page 122: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

109

まとめ

本調査研究では、モデル事業所のビッグデータを活用して、事故等の発生の予兆の検出

や事故等の発生を未然に防ぐための技術スタッフに対する気付きや注意喚起とともに、事

業所内における情報共有等に関する実証研究を行う。これにより、コンビナートの保安に

おける情報技術・各種データ活用等の有効性を検証し、自主保安の高度化に繋げることを

目的とした。

【Ⅰ】モデル事業所におけるビッグデータ活用の有効性実証では、鳥取大学と3社の再

委託企業による体制で、モデル事業所の9年間分のビッグデータ(ヒヤリハット報告とプ

ロセスデータ)に、自然言語処理、各種データサイエンス、知識体系化技術、および時系

列解析技術を適用して、事故等の発生の予兆検出や事故等の発生を未然に防ぐための技術

スタッフに対する気付きや注意喚起等に関する実証研究を行い、モデル事業所より、有効

性有り、あるいは期待できるとの評価を得た。これにより、コンビナート(モデル事業所)

の保安におけるビッグデータ活用の有効性を検証できた。

なお、モデル事業所の評価については、活動概要とともに、「表 1.8-1 活動の要旨(P.9)」

に示されている。

また、【Ⅱ】ビッグデータの情報処理後の情報共有の有効性の調査研究では、【Ⅰ】で情

報処理された情報やデータを、モデル事業所と鳥取大学、および再委託企業(3社)の5

者のみが専用に共有するためのプラットフォームのプロトタイプを試作し、情報やデータ

の秘匿性を確保した上で、開発技術(成果)の公開レベル別に公開性を明示化することで、

その有効性、及び課題を調査研究した。また、ビッグデータ解析で得られた事業所視点で

のインセンティブの明確化を行い、情報共有の有効性、および、これを活用するための提

言を行った。

本報告書において、ビッグデータの有効性、各種の情報処理方法、モデル事業所の技術

スタッフによる評価、コンビナート(モデル事業所)保安への有効性、および情報プラッ

トフォームの有効性と課題について報告した。

以上

Page 123: 調査報告書 - Minister of Economy, Trade and Industry · サイエンス、および知識体系化技術や時系列解析技術などによって、事故等の発生の予兆

(様式2)

頁 図表番号

6 図1.7-1

12 表2.1.1-1

70 図2.5-1

72 図2.5-2

76 図2.5-6

80 図2.5.13

84 図2.5-18

85 図2.5-19

88 図2.5-24

タイトル

ヒヤリハット報告書の例

モデル事業所におけるヒヤリハット報告フォーマット

DCS(分散制御システム)図面(2WWTのC-3202塔の周辺)

DCS図面上のプロセスデータ番号PC32005

二次利用未承諾リスト

委託事業名:

報告書の題名:平成27年度 経済産業省石油精製業保安対策事業(コンビナートにおける情報・データの活用を通じた自主保安の高度化に関する調査研究)調査報告書

受注事業者名:国立大学法人 鳥取大学

L-HTの反応塔とチャージヒーターの周辺のDCS画面

4LGOの分留装置C-4504と熱交換器E-4509の周辺のDCS画面

E-4509熱交換器の配管経路上のプロセス

ヒヤリハット発生に関するDCS画面

C-3202塔の周辺のDCS画面


Recommended