生物统计机器人项目

摘要

 

  • 全球大数据统计领域市场规模2.7千亿美元,其中软件约占39%,其中健康医疗统计分析市场规模占比为36%

  • 人工智能迅速进入医学和大数据领域,但在生物统计赛道,全球尚无真正的人工智能应用

  • 生物统计学科是建立在固定的规则和算法基础上的,未来必定会被人工智能全面替代

  • 中国两个潜在的竞争对手,易侕软件和极智分析,均不是人工智能,目前易用性不被市场接受

  • 本项目旨在建立中国首个生物统计学的人工智能解决方案

    • 开发to C端的统计分析机器人产品
    • 开发to B端的产业分析机器人定制化方案
  • 本项目短期商业目标

    • C端统计机器人覆盖全国400万医师的1%,4万人,每年营收200万元;

    • C端统计机器人覆盖全球医师20万,每年营收2000万元

    • B端定制化机器人覆盖100家药企、CRO公司或大数据公司,每年营收5000万元

    • 传统人力:专业化统计服务团队,每年营收1000万元

产业背景 - 市场规模

 

  • 2018年,大数据分析市场的价值估计为1690亿美元,IDC预计到2022年全球大数据分析市场收入将达到2740亿美元。

  • 2019年,大数据分析相关软件收入为670亿美元,其中最终用户查询、报告和分析工具(140亿美元)和关系数据仓库管理工具(120亿美元)是两个最大的软件类别。

  • 2018年,全球大数据收入的38%来自服务领域。 到2027年,软件细分市场预计将成为最大的大数据细分市场,份额为45%。

 

Source: IDC, Data Age 2025, Sponsored by Seagate

产业背景 - 市场现状

 

  • 生物统计主流软件:SAS(药监局指定临床试验统计软件)、R(医生科研为主)、SPSS(无需编程)

  • 非主流软件:jamovi(开源)、易侕软件、极智分析

传统软件SAS、R行业地位建立数十年,短期不可撼动,但均需要编程。广大医师编程困难。而非编程市场庞大。

SPSS非专为医学设计,学习成本高,不懂统计几乎不能操作。

易侕软件为XYsolution公司开发,迄今十余年,易用性强,但不是人工智能,不懂统计几乎也难以操作,目前付费用户1000人,年费约1000元,公司靠组建科研顾问团队线下盈利。

极智分析为江西速临科技有限公司开发,基于web,理念先进,功能完善,但开发团队非临床工作者,临床医生使用依然困难。注册用户4000人。

生物统计分析真正的市场需求

 

C端(临床医生):

  1. 无需编程

  2. 以临床医生的视角设计,根据研究设计类型引导用户,而不是让用户选择统计方法

  3. 包含人工智能,根据研究设计自动决定统计方法

  4. 以论文发表为导向,自动生成杂志投稿格式的统计图表,无需用户再加工

  5. 自动生成论文的大半文字部分(NLP输出)

B端(药企、CRO、大数据公司):

  1. 无需编程

  2. 远程分析,原始数据不离开服务器,成为大数据平台的多用户分析工具

  3. 和自己的数据源格式绑定

  4. 定制化分析模块

  5. 临床试验完成前的数据浏览,周期自动分析,预知结果

本项目前期准备

 

  • 主要人员从原单位离职
  • 成立初创公司
  • 开发初期产品
  • 小范围用户试用

公司简介

 

北京洪宇科技有限公司

 

成立日期:2022年6月

官网:www.b-hy.com

注册地:北京顺义区

注册资金:100万元

业务:开发睿智医学统计机器人,面向临床医生线上开展生物统计业务,线下医院科室推广软件和科研服务,面向药企、CRO和大数据公司推广定制化软件和一站式医学统计解决方案。

创业团队(筹)

 

赵洪鑫

曾任:北京壹永科技 副总裁; 森亿智能 真实世界研究总监; 罗氏制药 真实世界数据科学家; 葛兰素史克 高级统计师; 葛兰素史克 流行病学家; 比尔和梅琳达盖茨基金会 研究顾问

中山医科大学临床医学本科,复旦大学妇产科学硕士,复旦大学流行病与卫生统计学博士

近十年在葛兰素史克等跨国药企担任高级临床统计师,承担10多项国际多中心及中国三期临床试验,参与外企在中国的多个NDA submission项目。后转HEOR领域,在罗氏制药担任真实世界数据科学家、药物经济学家等职务,后主持组建健康大数据和知识中心,并主持大型IV期观察性研究和回顾性数据库研究10多项,药物经济学研究5项,并成功运作药物进入国家医保目录。

曾在森亿智能等大数据公司从事真实世界研究,与中电数据、浪潮集团等合作开展国家健康医疗大数据研究。 曾在北京壹永科技主导”国家抗肿瘤药物临床应用监测网”等大数据建设和应用工程并从事肿瘤大数据研究。大数据变现业务第一年实现营收1500万,第二年实现营收4000万,能排进同行(运营回顾性真实世界研究的大数据公司)前三名。
担任40余项国家健康医疗大数据研究Leading PI,累计发表学术论文五十多篇,论著一本,获得发明专利六项,上海市科技成果两项。

创业团队(筹)

 

邹超

优势:资深的医药及软件数据行业经验,丰富的政府、央企、行业资源。对中国医疗环境有深刻见解,具备快速建立全国销售及渠道团队、制定市场策略的能力。

工作经历: 2019.01-2021.05,上海怡道信息科技有限公司(原上海红会)副总裁兼福建分公司总经理;

2017.12-2019.01,上海森亿医疗科技有限公司药企生态部市场销售总监;

2009.07-2017.11,勃林格殷格翰(中国),历任大中华区策略市场部副总监,中央市场部高级产品经理,心血管团队高级地区经理,中央市场部调研专员,中央市场部管理培训生。

项目经历: 1.负责福州政府医械医耗监管项目,与福州市政府完成福州区域医疗器械耗材追溯管理平台搭建项目,并获得政府400万项目资金支持; 2.筹备并组建福建分公司,担任福建分公司总经理,负责福建地区软件产品的销售及数据业务的创新,公司软件产品在福建地区覆盖多家三甲医院,数据业务服务上游生产企业,如波士顿科学、美敦力、泰尔茂等1500余家,服务下游经销商3000余家; 3.挖掘基于国家大数据试点城市(国务院47号文中试点城市)电子病历数据的商业价值,与辉瑞、阿斯利康、礼来、勃林格殷格翰、优时比、默克等建立起紧密的商业合作关系并成功获得订单。

教育经历: 2005.09-2009.07,江苏海洋大学,生物工程

创业团队(筹)

 

王行

GE Healthcare 数据科学家
2011.09-2018.06 西安交通大学预防医学本硕
2018.09-2021.06 复旦大学流行病与卫生统计学博士

GE医疗影像部门数据科学家,承担临床研究设计与数据分析数十项,并参与数据分析软件的开发。

三年国家级电子病历大数据的真实世界研究经验,支持跨国药企相关研究十余项;对医学统计、电子病历等医疗大数据、基于机器学习的影像组学等医工交叉学科具有深刻的见解与实践。

帮助和指导过近百名医学生与医生的科研数据分析,对医务工作者科学研究的统计需求具有深入的了解。基本掌握市面上常用的统计分析软件,深刻了解其中的优势与弱点。

现有产品

 

睿智医学统计机器人

睿智医学统计机器人,是一个以临床研究设计为导向的人工智能医学统计分析平台,用户上传数据后,机器人能够根据研究类型和研究设计,智能选择统计分析方法,一键生成生统计表和统计图,匹配杂志格式要求,自动导出投稿要求的word版统计报告。

现阶段,阻碍临床科研发展的一大痛点就是临床医生不懂统计学,专业统计师和临床医生的配比极低,高校统计师的咨询费用已经达到1800元/小时。临床医生学习统计学的时间成本极高。另外,最大的矛盾并不是如何进行统计分析,而是如何用统计学思维设计研究,决定什么样的研究类型选择何种统计方法。

和市场竞争对手不同,睿智统计机器人由临床背景的学者开发,以临床工作者的思维方式出发,用户不需要十分理解统计学,是个傻瓜式、一站式的解决方案。
统计机器人的进化形态是成分析报告机器人或者论文机器人。以AI为基础生成论文手稿的大半部分。
统计机器人的终极形态是抢占药物研发深海领域,自动撰写SAP,SAR,颠覆传统业界规则,大幅降低药物研发和临床试验成本。

2022年7月至今开发完成10%内容,8月份在微信公众号试上线,一个月来有300名用户小范围内测,好评已爆表。

软件试用地址:www.b-hy.com/ai

和传统软件的不同点

 

  • 使用Web界面,和SAS和R的区别在于无需编程,全程鼠标操作

  • 和SPSS的区别在于:

    • SPSS的菜单从选择统计方法开始,不经过系统培训的医生使用比较困难
    • 睿智统计机器人的菜单从选择研究设计类型开始,全程使用引导性的临床语言
    • 睿智统计机器人根据临床研究设计自主选用统计模型,对统计知识要求较低
    • 睿智统计机器人以论文发表为导向,所有输出的统计表格和图形都无需再加工,符合医学类SCI杂志的发表规范
  • 和竞品”易侕软件”、“极智分析”的区别在于:

    • 竞品由统计学家和计算机科学家设计,仍然没有离开传统的统计学思维,和SPSS没有太大区别,没有统计知识的用户仍然无法使用
    • 竞品没有将人工智能结合进产品中,没有实现统计自动化和论文生成自动化的愿景和决心

主要功能模块都根据临床研究的设计来组织

 

功能模块举例:

 

  • 自动生成患者入排流程图

  • 自动生成基线特征表(Table 1)

  • 一键进行倾向性评分匹配

  • 一键进行两组疗效比较分析

  • 自动进行单因素和多因素影响因素分析

  • 一键生成亚组分析森林图

统计分析几乎都是全自动由人工智能生成

 

统计分析几乎都是全自动由人工智能生成

 

统计分析几乎都是全自动由人工智能生成

 

统计分析几乎都是全自动由人工智能生成

 

自动生成的word文档符合投稿杂志的图表格式标准

 

下一步支持的功能模块

 

  • 样本量计算

  • 数据预处理(归一、缺失数据填补、异常值处理)

  • 患者入排流程图

  • 基线特征表(Table 1)

  • 倾向性评分匹配(PSM)

  • 逆概率加权(IPW)

  • 两组疗效比较分析

  • 两组以上疗效比较分析

  • 单因素和多因素影响因素分析

  • 亚组分析

  • ROC曲线分析

  • 临床预测模型和nomogram

  • 多水平模型(混和效应模型)

  • 结构方程模型

  • 机器学习预测模型

  • 暴露和结局的曲线关系(广义相加模型)

  • 横断面研究全自动分析

  • 队列研究全自动分析

  • 病例对照研究全自动分析

  • 临床试验数据可视化

  • 临床试验定制化自动分析

  • 调查研究表单生成器

  • 在线调查网页自动生成器

  • Meta分析统计分析

  • Network系统评价统计分析

  • 公共数据库自动挖掘工具(SEER、MIMIC等)

  • 论文手稿生成器(自动生成Statistical method 和Results文字部分)

产品视频简介

 

C端用户反馈

B端机会

目标市场

 

短期

  1. 有科研需求的医学工作者

  2. 医院科室

  3. 药企

  4. CRO公司

  5. 大数据公司

未来

拓展到医学之外的领域,如心理学、计量经济学等

盈利模式

 

  1. 针对线上个人用户,开放免费和付费功能,采用下载报告计次付费和会员付费相结合。参考易侕软件高级会员年费约1000元
  2. 针对医院科室,采用批量采购,并针对学科领域做定制化开发。医院科室年费5-10万元
  3. 为药企、CRO、大数据公司定制化开发分析平台,单价在30-100万元
  4. 和医院信息化公司合作,将统计分析机器人嵌入其医院科研系统产品、CDSS产品或医生工作站,通过此类公司带货捆绑销售
  5. 通过线上用户流量渠道,进行广告售卖
  6. 通过线上用户流量渠道,成立线下科研服务团队,提供高端客户优质服务,参考行业咨询费用标准:1000-3000元/小时

目标和规划

 

第一年目标

  • 上半年完成可售卖版产品研发
  • 上半年集中广告推广,获取C端用户1万人
  • 下半年完成线下销售渠道部署,覆盖50家医院科室,20家数据相关企业
  • 下半年完成线下科研服务团队搭建
  • 达到500万营收

第二年目标

  • C端和B端用户数量翻倍
  • 完成进阶版人工智能产品研发
  • 达到1000万营收

第三年目标

  • C端统计机器人覆盖全国400万医师的1%,4万人,每年营收200万元;
  • C端统计机器人覆盖全球医师20万,每年营收2000万元
  • B端定制化机器人覆盖100家药企、CRO公司或大数据公司,每年营收5000万元
  • 传统人力:专业化统计服务团队,每年营收1000万元

天使轮融资计划

 

  • 计划天使轮融资500万元,出让10%股份

  • 第一年资金使用计划:

    • 公司办公场所租金,行政支出等 30万元
    • 产品搭建硬件支出,R shiny服务器端软件,服务器租聘等费用 20万元
    • 组建核心研发团队 50万*6人=300万
    • 线上推广广告费用,百度排名,网页广告,自媒体软文,市场人员薪水等 50万
    • 线下渠道建立,销售人员薪水,营销费用,经销商管理,参加行业会议发声等 100万

投资回报

 

根据对未来几年公司经营状况的预测,公司能保持较高的利润增长,拟从净利润中提取合理比例的资金作为股东回报。为此,公司第一年不分红,第二年以后每年分红为净利润的20%。

SWOT分析

 

优势

  1. 拥有最新的理念和优秀的创业者

作为近五年来为数不多的较为成功的大数据公司RWE创业和管理者之一,对整个行业的需求有充分的理解。

  1. 拥有最优秀的技术和知识产权

人工智能生物统计的底层逻辑和最重要的框架已经研发完毕。

  1. 用户体验极佳
睿智机器人产品试用者100%放弃了竞品
..

劣势

  1. 行业有成熟的软件SAS、R、SPSS且国内盗版泛滥
  2. 中国医师自主付费意识不高
3. 产品单价提升有限,对用户数量有较高要求

机会

  1. 健康医疗大数据产业崛起,RWE成热门行业,行业重视程度前所未有
  2. 医师科研需求与日俱增,统计服务严重脱节
  3. 药物研发领域成本高昂,数字化创新解决方案势在必行
  4. 全国各地大数据建设雨后春笋,几乎所有的新建数据库都有远程分析平台建设的需求

威胁

  1. 传统软件有朝一日也会向人工智能方向进化,压榨创新企业的空间
  2. 产品有被抄袭复制的可能