タイトル(別表記)
A Method for Inter-Broadcaster Data Integration of Non-Identifiable Television Viewing Log
フルテキストURL
著者
松田 裕貴 奈良先端科学技術大学院大学
榊原 太一 讀賣テレビ放送株式会社
真弓 大輝 奈良先端科学技術大学院大学
松田 裕貴 岡山大学
水本 旭洋 千葉工業大学
安本 慶一 奈良先端科学技術大学院大学
抄録
近年,各テレビ放送局において,個人を特定しない形式で,インターネット接続されたテレビから視聴開始時刻や視聴終了時刻等を含む非特定視聴履歴データを収集し,利活用する取り組みが進められている.しかし,各放送局は自局の非特定視聴履歴データしか利用できないため,膨大なデータを蓄積しているにもかかわらず,有用な知見を得るまでに至っていないのが現状である.さらに,非特定視聴履歴データの収集方式やデータ粒度は,各局各様となっており,各局が蓄積したデータを統合し,利用することもできていない.そこで本論文では,各局が独自の方式で取得している非特定視聴履歴データを放送局間で統合する手法を提案し,評価するためのシミュレータ設計と実装を行い,提案手法の評価を行う.
提案手法では,各局の視聴履歴データのうち,共通しているIPアドレス・郵便番号・メーカID・ブラウザメジャーバージョン・ブラウザマイナーバージョンの5項目でテレビ受像機を分離処理する.そして,分離された中でこれらの5項目が一致するテレビのうち,さらにチャンネル遷移時刻が一致するテレビを同一テレビと推定する.また,視聴者行動を再現するシミュレータを設計し,そのシミュレータから合成された視聴履歴データに対して,本手法を適用した結果,生成された250万台分のデータのうち約241万台のテレビIDのマッチングに成功し,再現率96.5%であることを示した.
抄録(別言語)
Recently, TV broadcasters have been collecting and utilizing non-personal TV viewing log data, including start and end times of viewing, from TVs connected to the Internet in a format that does not identify individual viewers. However, since each broadcaster can only use its own non-personal TV viewing log data, it has not yet been able to obtain useful knowledge despite the vast amount of data it has accumulated. In addition, the collection methods and data granularity of non-personal TV viewing log data vary from station to station, and the data accumulated by each station cannot be integrated and used. In this paper, we propose a method for matching non-specific viewing history data collected by each broadcaster using its own method, and design and implement a simulator to evaluate the proposed method. The proposed method estimates that TVs whose channel transition timing matches five items collected at the time of viewing history data collection (IP address, zip code, manufacturer ID, browser major version, and browser minor version) are the same TVs. In addition, we designed a simulator that reproduces viewer behavior and applied this method to the viewing history data synthesized from the simulator. As a result, we succeeded in matching approximately 2.41 million TVs out of the 2.5 million units of data generated, showing an identification rate of 96.5%.
キーワード
テレビ (TV)
視聴履歴データ (TV viewing log data)
ビッグデータ (Big data)
IoT
クロスデバイスマッチング (Cross-device matching)
クロスデバイストラッキング (Cross-device tracking)
備考
ここに掲載した著作物の利用に関する注意 本著作物の著作権は情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。

Notice for the use of this material The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof.
All Rights Reserved, Copyright (C) Information Processing Society of Japan.
Comments are welcome. Mail to address editj@ipsj.or.jp, please.
発行日
2024-10-15
出版物タイトル
情報処理学会論文誌
65巻
10号
出版者
情報処理学会
開始ページ
1488
終了ページ
1500
ISSN
1882-7764
NCID
AN00116647
資料タイプ
学術雑誌論文
言語
日本語
OAI-PMH Set
岡山大学
論文のバージョン
publisher
DOI