教育房产时事环球科技商业
投稿投诉
商业财经
热点动态
科技数码
软件应用
国际环球
晨报科学
新闻时事
信息智能
汽车房产
办公手机
教育体育
生活生物

哪里买数据(消费数据从哪获得)

  编辑导语:数据,对于任何平台或者企业来说,都很重要。无论是想要做出一些营销决策还是调整新产品的发布策略,数据的收集和分析都是必经的一环。对于医药O2O电商平台来说,得到权威而又准确的数据,尤其是药品和病症之间的关系数据源,显得尤为重要。
  本文复盘一次药学服务数据购买的案例,呈现当时的处理方式和遇到的问题。
  该"买数据"案例,发生在做医药O2O电商平台,药品这一特殊的电商商品,其"健康属性",可以作为附加值提供的载体。如,卖药的同时附加提供健康服务,以药学服务拉近"人货场"的温度,打造线上线下产业化新零售生态。
  药学附加服务,无论是用药指导、寻医问药,还是患者画像之类的,前提都是要有药品-病症之间的关系数据源。
  这个数据即要权威准确,又要通俗易懂,兼顾科学化和网络大众化。市场上单纯的医药数据,或单纯的药品商品数据,都不难获得。难获得的是,针对医药电商人群和故事场景下的医药健康的资料。
  本案例涉及到的内容清单:
  一、前期需求分析1. 分析需求
  基于项目规划,将本次药学服务的需求场景,归纳如下:
  这就要求,数据中起码涉及这些字段:用法用量、功能主治、适用人群、禁忌不良反应、服药周期、治疗的疾病、疾病的症状、疾病说明等。结合业务场景,可以勾勒出这样的简单的关系图:
  2. 确定核心要素
  根据以上需求,我们可以得知 "药"、"病"、"症" 三者最为核心,关系如下:
  且三者为多对多关系,如下:
  3. 评估数据量级
  常规药品的数量,达到6万种(SKU)。
  药品基本都是单规格的(不同含量视为不同规格,不同含量不同的申报,业内视为不同的商品),因此大约要准备接近这个数字的药品资料,才能保证覆盖面。
  总结:至此,从需求要素、核心内容、需求数据量范围,描绘了拟获取数据的轮廓,作为寻找数据源的验收标准或参考。
  二、调研获取数据的途径
  我们的目标数据,是客观标准的基础数据,不是运营产生的数据。因此权威性、客观性最重要,那么如何获取呢?
  1. 假如自己维护?
  请专人、找到药盒、翻阅药品说明书、录入、再翻阅医药词典类数据、对应整理疾病信息……平均一天一人最多搞定100条,算下来6万就要很久。
  显然来不及且成本不菲,并且没有验证的数据也不敢用,这条途径pass。
  2. 爬别人的数据
  药品信息在药监局官网比较权威,但是上面没有疾病方面的,甚至连条形码都找不到(备注:条形码,国内就是69码,唯一标识商品,13位、12位或8位数字组成)。
  爬取其他网站,也曾尝试的,结果不是不准确、不齐全,就是不成功,这条路也走不通。
  3. 购买数据
  购买数据比起爬数据要正规些,咨询了京东阿里和腾讯丁香,人家都不卖。这些公司是要自己做数据服务的,也不差这点钱。
  咨询了药房网、135网,没疾病方便的可靠数据,这时候业内人事推荐了一个叫"YA"的公司,在做药学服务,就决定深入商谈。
  三、拿到样本数据
  经过洽谈,对方提供的是一批EXCEL格式的样本数据。大概的表有14个表格,数据拿到之后,进行初步验收。
  1. 比对E-R模型
  他们的数据是mongdb存储的,首次抽离出来数据来卖,所以数据在表结构和表数量上有冗余。通过其表结构,绘制出E-R图,基本与需求符合。
  2. 竞品横向对比
  在检查样本数据的过程中,也在做替代方案的对比。
  制定检验要点是:单表数据的错误率、联表查询的匹配率、市场数据的覆盖率、错误修复时效等。从网站或App寻找同类产品,但都有各种问题,最终还是舍弃了其他选项。
  3. 远程全量检查数据
  在未付款情况下,对方不提供全量数据。
  由于样本有限,为了进一步了解数据,协商采取远程查数据库。对方在数据库中进行了单表验证和联表查询操作,我方远程观看,并记录检查结果。
  远程的操作毕竟是不便,只交叉抽样验证了部分数据,当时估计出的准确率是93%——这也是决定继续洽谈的主要参数。
  四、付首款并拿到全量数据
  接下来的流程是谈价格,价格谈好就可以打包出售数据。
  我方压价的论点主要是:疾病方面的数据不到一万条,买回后仍需补充的人工成本;非独家买断,可以复制销售,卖家边际成本很低,内容质量不高。
  口头说的是由执业药师团队和药师专业、中国非处方药物协会药师进行审核。但是并拿不出证据,最终得到了折扣,拟定了全量数据验收的合同。
  当时的合同内容比较简单,草稿截图如下:
  合同签署后,拿到了全量数据。
  双方约定一周的时间进行数据验收,验收无误则支付尾款。因为数据的敏感性,由专人以邮件压缩包文档的方式接收。然后存入堡垒机中,其他参与验收人员通过堡垒机进行检验。
  1. 研究数据的质量
  检查数据的合理性:也就是数据在逻辑机构上的是否有缺陷。
  数据的关联度:采取的是手动在EXCEL上比对,并导入数据库后程序员SQL查询相结合的方式。基于对基础数据的了解,制定了检查方案,局部如下图:
  2. 检查数据的权威性
  这一点需要专业药师或药学人员参与,我们采用的是抽样调查的办法,比对的标杆是药典的权威资料,考察的对象比如"阿苯达唑"的服用时间、用药禁忌等。
  3. 数据的覆盖率
  采用的办法是,指定20个常用药物(比如对乙酰氨基酚),看是会否能查到全套的资料,得到的结论是数据并不理想。
  比如:用条形码匹配已有的商品,发现有1579个找不到,占比20.87%;再用这1579个的通用名查找,仍有147个仍找不到,即绝对找不到的比例1.9%。
  4. 数据的冗余性
  很多表都是从MongDB转化过来的,所以表之间的结构不合理。最终14个表,也就有7个表是有用的,其余的多是过度表(初步验收时候虽然也发现了)。
  5. 双方交涉
  其实大家看得出,全量数据的检测结果不理想。
  主要发生在,表结构不合理;数据存在错误、一些名词在各表中的表述不一致等。但是这个时期,合同的约定并不利于买方,因此只能继续往前。
  我们在一周内输出了问题清单,抠合同字眼,寻找有利的机会,然后责令对方将数据清洗后重新交接。
  五、数据购买后的应用规划
  在经历5次数据交付后,双方法务协商一致,进行了价格的调整,最终完成了交易。
  如果把验收当做一次项目,那么虽然项目做的不太漂亮,但是数据还是有价值的,是可用用的。
  数据拿到了,技术层面进行应用规划:第一步,元数据检查和清洗,将14个表,抽离成整洁的新表;第二步,指定底层服务逻辑,以作为数据中台,供应用端接口调用。
  比如:
  第三步:对接具体业务场景,输出具体方案(此处略)。
  六、总结1. 本次数据购买主要涉及三方面产品角度的需求锲合度;医药专业角度的数据权威性;法务层面的合同约定项:其中后两点都没做太好,尤其是法务方面,这导致了全量数据拿到之后的进退两难。
  但是项目自身也存在局限性和难度:比如数据量大,很难发现细节问题;缺少标杆,自行推敲只能抽样调查的方式;数据的价格方面没有固定的标准,难以拿捏。
  2. 数据购买带来的经验教训自身对数据的需求范围和目标明确;了解卖家,和卖家数据的影响力;应当在购买之前,应该了解还有谁买过或者用过,调查口碑;在于对方接洽之前,准备充分的行业和技术方面的验证标准和计划;制定基本的项目步骤,比如:前置研究、评估成本、购买谈判、后置约束;在拿到全量数据之前,应当充分采取远程调查的手段,挖掘对方数据的漏或者不足,以作为合同约定和议价的前提;在合同签署中,更多约定对"隔皮断货"的风险的鉴定标准和卖方的责任。这个份文档一定要提供给行业专家、法务,以便将来拿到真实数据之后,可进可退;合同中要约定验收过程问题的处理办法,验收成本谁来负责,验收不通过的最大次数等。
  #专栏作家#
  唧唧歪歪PM,公众号:唧唧歪歪PM(ID:jjyypm),人人都是产品经理专栏作家,2019年年度作者。《后端产品经理宝典》作者,药学硕士转行互联网产品多年;熟悉跨境电商业务,医药领域;擅长大型后台体系,社交APP。
  本文原创发布于人人都是产品经理,未经作者许可,禁止转载
  题图来自Unsplash,基于CC0协议

700公里多少油钱(700公里油耗多少)自驾过西藏的驴友,回来都有一个感受,为什么在西藏那么省油呢,不是我一个人的感觉,而是都是这种感觉,自驾西藏到底是否省油,说一下就立马明白了。每次从安多加满一箱油,总共45升,在这里高速每公里多少钱(一千公里在高速上多久算超时)有些车主在高速上长时间行驶后容易犯困,往往会选择到服务区休息一下。尤其是房车大货车司机,如果晚上开车遇到服务区,大多都会在服务区休息一宿等到第二天再走。但在这种情况下,很可能会睡出高速一公里多少钱(高速轿车多少钱一公里)现在的人们有钱又有时间,节假日的时候要么开车出去旅游,要么就开车回老家。刚好前段时间有一位车友私信老苗,说自己打算过两天开车回老家,一共1000公里,走国道和走高速哪个更省钱?为了一公里多少油(正确的油耗计算公式)很多车友非常关心爱车的油耗,主要是油价太高,车友荷包不暖和。所以都要算算经济帐。车辆油耗是如何计算的呢?一般是以百公里耗油多少升或百公里用油多少钱来核定。很多车辆仪表都显示车辆百公找黑客帮忙要多少钱(正规黑客联系方式)找黑客帮忙要多少钱(正规黑客联系方式)现在的互联网环境表面光鲜亮丽,背后却千疮百孔,难以追踪的网络攻击层出不穷,大量互联网设备被捕捉变成傀儡。在我们看不到的暗处,一场场战争上演着。黑客盗一次号多少钱找黑客盗取微信需要多少钱黑客盗一次号多少钱。可能感兴趣的文章相关问题黑客在线接单多少钱。相对最主要的是看怎么使用空调机。1。黑客教你一分钟盗微信号首先确保整个黑客盗号多少钱方案是最有效的,在做一件黑客盗一让黑客帮忙一般要多少钱(求真正黑客追回网赌输的钱)你被骗了第一时间会怎样?当然马上要找警察蜀黍但没想到有人会另辟蹊径找上了黑客???近日南海就有一女子被电信诈骗17万后没有第一时间报警而是听朋友建议找了黑客帮忙不料钱没追回来又被骗摩托车年检多少钱(摩托车如何年检及费用)摩托车和汽车一样属于机动车,也是需要年检的。上午天气正好,那就骑上小摩托去年检吧。外环线以内禁摩,外环线可以通行不得不说外环线上,汽车对摩托车相当友好,一路上没有一辆车按喇叭催促。汽车年多少钱(六年内的车年检多少钱)车千秋导读自2020年以来各地年检价格相比以前都发生了一定幅度的上涨,甚至有些城市的年检价格都突破了400大关。而合肥2021年车辆年检费用标准并没有太大变化。合肥车辆年检费用标准全身抽脂手术多少钱(重庆全身吸脂大概价格)最近不少人问江医生全身吸脂一次可以做完吗?随着医学技术的逐渐发达使得前往医院进行吸脂手术的人群逐渐增多不少求美者都会提出这样的疑问自己全身都很胖腰腹大腿小腿手臂等想同时进行这样可以抽脂的费用是多少(手指抽脂手术多少钱啊)爱美之心,人皆有之,我们应该管理好自己的身材和容貌,这一点毋庸置疑,但是这里面就充斥着很多人的盲目,而这些盲目的消费者,则为了能够快速达到目的,而花费重金,这中间就给很多的商家制造
40万的车保险多少钱(30万车保险一年多少钱)新车买来只需要购买四项险种就可以,它们分别是交强险车船税第三者责任险不计免赔和车损险,基本上购买了这四项险种在日常用车中就完全够用了,下面就给大家介绍下,这四项险种的理赔范围。购买车年审需要多少钱(取消15年车一年两审)在2019年汽车尾气检测新标准正式执行后,我们就有发过多地上调汽车年检费用的情况。而根据部分地区车主或媒体反映,2021年年检费用似乎又调整了。因为2019年11月环保新标准的发布车险一年多少(车险大概费用多少钱)家里有辆车已是很多普通家庭标配,有些中产家庭,甚至能有两辆车。有了车,就要上保险。但车险品种有很多,什么交强险车损险三责险涉水险光听名称就头疼,到底该怎么选呢?没有经验的车主很容易保险一年多少钱(保险一个人一年多少钱)其实收入低的家庭,抗风险能力是很弱的。一个万一就可能摧毁一个家庭。想知道,怎么提高家庭抗风险的能力?如何给家人更好的保障?花多少钱买保险合适?收入低的情况下花多少钱买保险合适?这里车保险多少钱(20万的车保险一年多少钱)因为第一年车险一般都是4S店办理好的,所以很多人第二年的时候就不知道保险该怎么买了,新车第二年续保大概多少钱等,这些都是车主关心的问题。新车第二年续保多少钱车险第二年的保费与上一年医保保多久(医疗保险交一次管多久)按照城镇职工医保制度的规定,参保人在办理退休时如果达到当地政府部门规定的缴费年限,不再缴纳医疗保险而终身享受医保退休待遇,这就是大家所说的医保退休待遇。下面和大家分享相关知识要点我福特野马猛禽将于2022年上市福特退伍军人在该公司服务了28年,在社交媒体上发了一个偶然的帖子,几乎证实了福特BroncoRaptor已经过绿灯供生产。在2019年中期,有关高性能福特野马的报道浮出水面,该项目虾米2015福特野马掀背车?信不信由你!2015年的福特野马将会有一辆双门掀背车。至少,这项消息是从野马首席工程师DavePericak的口中说出。他最近接受CarampDriver专访,透露设计团队曾考虑斜福特野马为什么没人买(福特野马这个车怎么样)今天我们说说福特野马,额对了,它不能叫野马了,福特Mustang这车,车子本身其实是可以的,国内跑车贵的根本原因在于多数都是纯进口的,进口税和排量税导致普遍都比较贵,同类还有雪佛兰福特野马怎么样(福特野马什么档次)哈喽!大家好检车家老司机又和大家见面了,我是二手车检测师洋葱。因为我的本名和洋葱很相近,大家就经常错叫我洋葱,久而久之就都这么叫了。欢迎收看本期的二手车检测趣事今天给大家分享的车型锁芯怎么换(防盗门换锁芯怎么换)1。选择好锁芯后,拧开下手板的上下螺丝,主要用来固定面板,准备一把十字螺丝刀就可以了,很简单。2。拧紧螺钉后,将螺钉放入到位,并拧下锁芯两侧的螺钉。但安装时注意不要把这两个螺丝拧得