ウェアラブル腕時計型デバイスのデータから、睡眠状態を判定してみよう!

株式会社テックドクター

推奨スキル
Python

MISSIONについて


要件定義

市販のウェアラブル腕時計型デバイスで、様々なバイタルデータが取れるようになってきています。近い将来、バイタルデータから自分の心身の健康状態を確認し、調子をよくする時代が必ず来るでしょう。 このMISSIONでは、ウェアラブル腕時計型デバイス・Fitbitによって測定した実際の心拍・睡眠データを活用し、心拍データから睡眠状態の判定を行う機械学習モデルを構築します。 具体的には、心拍データを入力すると、"wake"、"rem"、"light"、"deep"といった睡眠段階を出力するマルチクラス予測モデルを作成してください。

今回使っていただくデータはこちらです。

https://drive.google.com/drive/folders/12qFePXlOxneJhfQvxQnp3WCLvJn2CLws


コンプリート特典

MISSIONをクリアした方が選考を希望する場合、ESを免除し、一次面接からご案内します! 特別採用フロー:ES(免除)→一次面接(人事/リードデータサイエンティスト)→二次面接(社長/CTO)→内定

学べること

・Fitbitで取得した実際の心拍データ・睡眠データなどの活用 ・データの可視化や統計解析、モデル作成 ・ドメイン知識の収集法や、データとドメイン知識の連携 ・Pythonを用いたデータサイエンスの実践手法

MISSIONを進める上でのヒント

Fitbitデータについて 心電図で取得できるような心電波形とは違い、Fitbitで取得できる情報は約5秒ごとの平均心拍数データである。 以下の記事も参照してください。 ①「Fitbit(selfbase)でどのようなデータを取得することができるのか(心拍・アクティビティデータ編)https://note.com/techdoctor/n/n907081c62b71 ②「Fitbit(selfbase)でどのようなデータを取得することができるのか(睡眠編)」https://note.com/techdoctor/n/n3818fc9e4d1f ドメイン知識 ① ドメイン知識の収集法 既存の出版物を参考にする。書籍だけでなく論文を参考にすることで最新の情報に触れることができるため、ここでは論文検索について簡単に紹介する。 Google Scholar(https://scholar.google.jp/)やPubMed(https://pubmed.ncbi.nlm.nih.gov/)といった論文検索サイトで検索することができる。 論文のなかには、Open accessといって無料で閲覧可能なものもあれば、閲覧のため料金を支払う必要のあるものもある。大学や企業によっては論文雑誌の発刊元と契約し、学認フェデレーションによって閲覧可能な場合があるが、一度に多量の論文ダウンロードや目的外使用の禁止、著作権、知的財産権の侵害が禁止されていることに注意する必要がある(所属機関の注意事項を参照してください)。 以下に今回の課題に関連するような論文のURLを日本語・英語のものそれぞれ1本ずつ掲載する。この論文を参考にしてほしいという訳ではなく、あくまでこのような例があるという例示にすぎないが、日本語なら「睡眠段階」「心拍」、英語なら"sleep stage", "heart rate"といったキーワードや、論文の最後にある参考文献リストは参考になるだろう。 [論文・例] 武田ら「心拍変動を用いた時間依存睡眠段階遷移モデル」 DEIM Forum (2015) https://db-event.jpn.org/deim2015/paper/24.pdf Meng X. et al., "Sleep stages classification based on heart rate variability and random forest", Biomed. Signal Process Control 8(6), p.624-633 (2013) https://doi.org/10.1016/j.bspc.2013.06.001 ② 心拍変動とは 心電波形は一般に、特徴的なピーク(このピーク地点をRと呼ぶ)を持ち、隣り合ったピークとピークの間隔をRRI(R-R間隔, R-R Interval)と呼ぶ。RRIは健康な人だと900 ms程度で推移するが、メトロノームのように一定のリズムを維持するものではなく、ある程度のゆらぎを持つものである。このRRIの変動は「心拍変動(HRV)」と呼ばれ自律神経系の影響を受けていると指摘されており、単純な統計的特徴を抽出したり、周波数的に解析したり、非線形的特徴を抽出したりとさまざまな検討をし、健康状態との関係を探索する活動が行われている。 HRVから算出できるパラメータについては、pyHRV(https://github.com/PGomes92/pyhrv)などのオープンソースのHRV解析モジュールを参考にすると良い。 このとき留意すべき事項として、上述の通り、本MISSIONで扱うデータは約5秒平均の平均心拍数データであることだ。平均心拍数から平均RRIを算出し、さまざまな特徴を抽出していく。特に周波数解析については、今回使うデータが正確な心電波形ではないため本来の特徴が抽出できない可能性がある。 ③ 睡眠ステージとは 先行研究によれば、睡眠状態には5つのステージ"Stage W", "Stage R", "Stage N1", "Stage N2", "Stage N3"がある。"Stage W"は覚醒状態で、"Stage R"は「レム睡眠」、"Stage N1", "Stage N2", "Stage N3"は「ノンレム睡眠」に分類される。 レム睡眠とは鮮明な夢をみる睡眠段階とされ、一般に就寝時間が進むにつれて長くなる。一方、より脳の活動が少ないノンレム睡眠には、浅い睡眠のステージと深い睡眠のステージがあり, 特に深い睡眠は一般に就寝直後に長く現れる。 睡眠ステージやその判定、判定手法についてはアメリカ睡眠医学会(https://aasm.org/)がガイドラインを策定し、それに基づいて実施されている。

その他情報

▼株式会社テックドクター 企業サイト
https://www.technology-doctor.com/

▼研究内容や企業カルチャーなど、noteで発信しています
https://note.com/techdoctor/

MISSIONコンプリートまでのステップ

1
2
3
4
5
6
1

企業情報

採用担当者
向坂真弓
採用担当
Message
株式会社テックドクターのMISSIONを選んでいただきありがとうございます。 私たちは「データで"調子"をよくする時代へ」をビジョンに掲げ、2019年に慶應義塾大学医学部の研究チームから創業したヘルステックスタートアップ企業です。 人々が自分の人生と向き合うためにも、医療に関わる人々の負担を軽減するためにも、日常の自分のデータを蓄積し持ち歩く、そういう世の中になると私たちは考えています。 このMISSIONでは、データサイエンスを少しかじったことがあるという方でも、楽しく、取り組めんでいただけるような内容になっています。 ユーザー10人分、約1,600行のデータを使って、データを取得し、分析からモデリングまで一気通貫で体験していただきます。 市販のウェアラブルデバイスでどのようなデータが取れ、そこからどんなことが分かるのか。バイタルデータやヘルステックに興味のある方のMISSIONチャレンジをお待ちしています!

株式会社テックドクター
▼株式会社テックドクター 企業サイト

▼研究内容や企業カルチャーなど、noteで発信しています
MISSION