概述
文章目录
- 前言
- Taks1——赛题理解
- 1.1 学习目标
- 1.2 了解赛题
- 1.2.1 赛题概况
- 1.2.2 数据概况
- 1.2.3 预测指标
- 1.3 代码示例
- 1.3.1读入数据
- 总结
前言
赛题以心电图数据为背景,要求选手根据心电图感应数据预测心跳信号,其中心跳信号对应正常病例以及受不同心律不齐和心肌梗塞影响的病例,这是一个多分类的问题。详情可参见链接:https://tianchi.aliyun.com/competition/entrance/531883/introduction
提示:以下是本篇文章正文内容,下面案例可供参考
Taks1——赛题理解
1.1 学习目标
- 理解赛题数据和目标,清楚评分体系;
- 下载数据,完成运行代码.
1.2 了解赛题
- 赛题概况
- 数据概况
- 预测指标
- 分析赛题
1.2.1 赛题概况
赛题以预测心电图心跳信号类别为任务,数据集报名后可见并可下载,该数据来自某平台心电图数据记录,总数据量超过20万,主要为1列心跳信号序列数据,其中每个样本的信号序列采样频次一致,长度相等。为了保证比赛的公平性,将会从中抽取10万条作为训练集,2万条作为测试集A,2万条作为测试集B,同时会对心跳信号类别(label)信息进行脱敏。1.2.2 数据概况
train数据概况Field | Description |
---|---|
id | 为心跳信号分配的唯一标识 |
heartbeat_signals | 心跳信号序列 |
label | 心跳信号类别(0、1、2、3) |
testA的数据集无label这一列,同时,heartbeat_signals这一序列比较长.
1.2.3 预测指标
选手需提交4种不同心跳信号预测的概率,选手提交结果与实际心跳类型结果进行对比,求预测的概率与真实值差值的绝对值。
具体计算公式如下:
总共有n个病例,针对某一个信号,若真实值为[y1,y2,y3,y4],模型预测概率值为[a1,a2,a3,a4],那么该模型的评价指标abs-sum为 a b s − s u m = ∑ j = 1 n ∑ i = 1 4 ∣ y i − a i ∣ {abs-sum={mathop{ sum }limits_{{j=1}}^{{n}}{{mathop{ sum }limits_{{i=1}}^{{4}}{{ left| {ymathop{{}}nolimits_{{i}}-amathop{{}}nolimits_{{i}}} right| }}}}}} abs−sum=j=1∑ni=1∑4∣yi−ai∣ 例如,某心跳信号类别为1,通过编码转成[0,1,0,0],预测不同心跳信号概率为[0.1,0.7,0.1,0.1],那么这个信号预测结果的abs-sum为 a b s − s u m = ∣ 0.1 − 0 ∣ + ∣ 0.7 − 1 ∣ + ∣ 0.1 − 0 ∣ + ∣ 0.1 − 0 ∣ = 0.6 {abs-sum={ left| {0.1-0} right| }+{ left| {0.7-1} right| }+{ left| {0.1-0} right| }+{ left| {0.1-0} right| }=0.6} abs−sum=∣0.1−0∣+∣0.7−1∣+∣0.1−0∣+∣0.1−0∣=0.6
1.3 代码示例
1.3.1读入数据
import pandas as pd
import numpy as np
import csv
#数据读取
path = 'D:\anaconda\python_work\kaggle心电图信号多分类预测\'
train_data=pd.read_csv(path+'train.csv')
test_data=pd.read_csv(path+'testA.csv')
print('Train data shape:',train_data.shape)
print('TestA data shape:',test_data.shape)
train_data.head()
总结
由于这是一个多分类问题,那么相应的,我们需要去了解这一类问题应该怎样解决,这是重中之重的,剩下的内容下一篇再完成吧.最后
以上就是火星上小甜瓜为你收集整理的心电图心跳信号多分类预测——赛题理解及baseline学习前言Taks1——赛题理解总结的全部内容,希望文章能够帮你解决心电图心跳信号多分类预测——赛题理解及baseline学习前言Taks1——赛题理解总结所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复