国家药监局发布人工智能医疗器械注册检查辅导准则的布告(2022年第8号)
阅读 178
发布时间 2024-05-18 11:00:42 | 作者:雷火电竞亚洲电竞先驱者

  原标题:国家药监局发布人工智能医疗器械注册检查辅导准则的布告(2022年第8号)

  2022年3月9日,为进一步标准人工智能医疗器械的办理,国家药监局器审中心安排拟定了《人工智能医疗器械注册检查辅导准则?》,并与今天发布。

  2022年3月9日,为进一步标准人工智能医疗器械的办理,国家药监局器审中心安排拟定了《人工智能医疗器械注册检查辅导准则》,并于今天发布。

  本辅导准则旨在辅导 注册请求人树立人工智能医疗器械生计周期进程和预备人工智能医疗器械注册申报资料,一起标准人工智能医疗器械的技能审评要求,为人工智能医疗器械、质量办理软件的系统核对供给参阅。

  本辅导准则是对人工智能医疗器械的一般要求。注册请求人需依据产品特性和危险程度承认本辅导准则详细内容的适用性,若不适用胪陈理由。注册请求人也可选用其他满意法规要求的代替办法,但需供给翔实的支撑资料。

  本辅导准则是在现行法规、强制性标准系统以及当时科技才能、认知水平下拟定的,跟着法规、强制性标准系统的不断完善以及科技才能、认知水平的不断展开,本辅导准则相关内容也将当令调整。

  本辅导准则是供注册请求人、审评人员和检查人员运用的辅导文件,不触及行政批阅事项,亦不作为法规强制履行,应在遵从相关法规的前提下运用本辅导准则。

  本辅导准则作为数字医疗(Digital Health)辅导准则系统的重要组成部分,选用和遵从医疗器械软件、医疗器械网络安全、移动医疗器械、医疗器械人因规划、医疗器械独立软件出产质量现场检查等相关辅导准则的概念和要求。

  本辅导准则是人工智能医疗器械的通用辅导准则[1],其他含有或触及人工智能技能的医疗器械辅导准则可在本辅导准则根底上结合详细状况进行有针对性的调整、修正和完善。

  本辅导准则适用于人工智能医疗器械的注册申报,包含第二类、第三类人工智能独立软件和含有人工智能软件组件的医疗器械(包含体外确诊医疗器械);适用于自研软件的注册申报,现成软件组件参照履行,不适用于外部软件环境。

  本辅导准则也可用作人工智能医疗器械的系统核对参阅。质量办理软件若选用人工智能技能完结其功用或用处,亦可参阅本辅导准则的适用要求。

  本辅导准则所述人工智能医疗器械是指依据“医疗器械数据”,选用人工智能技能完结其预期用处(即医疗用处)的医疗器械。

  医疗器械数据是指医疗器械发生的用于医疗用处的客观数据,如医学影像设备发生的医学图画数据(如X射线、CT、MRI、超声、内窥镜、光学等图画)、医用电子设备发生的生理参数数据(如心电、脑电、血压、无创血糖、心音等波形数据)、体外确诊设备发生的体外确诊数据(如病理图画、显微图画、有创血糖波形数据等);在特别景象下,通用设备(非监管方针)发生的用于医疗用处的客观数据亦归于医疗器械数据,如数码相机拍照的用于皮肤疾病确诊的皮肤相片、健康电子产品搜集的用于心脏疾病预警的心电数据等。依据医疗器械数据包含医疗器械数据的生成、运用等状况,其间运用状况含独自运用医疗器械数据,或许以医疗器械数据为主联合运用非医疗器械数据(如患者主诉信息、查验检查陈述定论、电子病历、医学文献等)。

  人工智能是指机器表现出与人类智能相关行为的才能,一般是指经过感知周围环境做出合理举动以到达预期方针的核算机软件或系统。机器学习是指与人类学习行为相关的人工智能,一般是指经过收拾现有数据和/或获取新数据以进步功用的核算机软件或系统。机器学习虽是人工智能的子集,但却为人工智能的中心范畴,当时二者关于医疗器械而言意义根本相同,故本辅导准则从医疗器械安全有用性点评视点动身对二者不做严厉区别,一致选用人工智能进行表述。

  依据非医疗器械数据的医学人工智能产品,或许选用人工智能技能完结非医疗用处和非医疗器械功用(详见医疗器械软件辅导准则)的医疗器械均非人工智能医疗器械。医学人工智能产品是否按医疗器械办理,依据相应分类界定辅导准则进行断定,必要时请求医疗器械分类界定。

  从医疗器械软件视点,人工智能医疗器械可分为人工智能独立软件和人工智能软件组件,故其类型区别可参阅医疗器械软件辅导准则相关维度。

  人工智能医疗器械从用处视点可分为辅佐决议方案类和非辅佐决议方案类。其间,辅佐决议方案是指经过供给医治活动主张辅佐用户(如医务人员、患者)进行医疗决议方案,如经过病灶特征辨认、病灶性质断定、用药辅导、医治方案拟定进行辅佐分诊、辅佐检测、辅佐确诊、辅佐医治等,相当于用户的“帮手”。反之,仅供给医疗参阅信息而不进行医疗决议方案即为非辅佐决议方案,包含流程优化、医治驱动,前者如成像流程简化、医治流程简化等,后者如成像质量改进、成像速度进步、主动丈量、主动切割、三维重建等,相当于用户的“东西”。此外,辅佐决议方案和非辅佐决议方案从实时性视点均可细分为实时和非实时,前者危险一般高于后者。

  人工智能医疗器械从功用视点大体上可分为处理功用、操控功用、安全功用。其间,处理功用又可分为前处理功用和后处理功用,前处理功用是指搜集人体解剖、生理信息生成医疗器械数据进程的处理功用,如成像流程简化、成像质量改进、成像速度进步等;后处理功用是指运用医疗器械数据生成医治信息或进行医疗干涉进程的处理功用,如医治流程简化、主动丈量、主动切割、三维重建、病灶特征辨认、病灶性质断定、用药辅导、医治方案拟定等。操控功用是指操控/驱动医疗器械硬件运转的功用,如闭环操控、机械臂运动操控等。安全功用是指确保医疗器械安全性的功用,如危险预警、急停操控等。

  人工智能医疗器械从算法视点具有多种类型区别维度。从学习战略视点可分为有监督学习和无监督学习,前者需求对练习数据进行标示,如线性回归、逻辑回归、决议方案树、朴素贝叶斯、K近邻、支撑向量机等经典回归、分类算法,后者无需对练习数据进行标示,如K均值、主成分剖析等经典聚类、降维算法,前者关于数据标示的要求高于后者。从学习办法视点可分为依据模型的算法和依据数据的算法,前者选用核算模型、规矩推理等办法,后者首要选用大数据办法,前者关于练习数据量的要求低于后者。从可解释性视点可分为白盒算法和黑盒算法,前者特征提取需求人为干涉,可与现有医学知识树立相关,后者主动完结特征提取,难与现有医学知识树立相关,前者可解释性优于后者。

  上述类型区别维度彼此穿插,例如:前处理和后处理均可选用不同类型的人工智能算法完结辅佐决议方案、非辅佐决议方案用处,有监督学习和无监督学习既可选用依据模型的算法、依据数据的算法,又可选用黑盒算法、白盒算法。一起,同一维度亦不存在严厉的区别界线,例如:在用处方面,经过图画辨认技能进行流程优化则需考虑医治驱动相关要求,主动丈量成果若为医疗决议方案重要方针(如血流储藏分数FFR)则归于辅佐决议方案范畴;在功用方面,操控功用、安全功用可与处理功用相结合,前处理进程可包含后处理功用;在算法方面,某些算法既可用于有监督学习又可用于无监督学习,有监督学习和无监督学习可结合为半监督学习;依据模型的算法亦需数据的支撑,依据数据的算法亦可生成模型;白盒算法和黑盒算法可组合运用成为灰盒算法。

  相同,人工智能医疗器械从老练度视点可分为老练和全新两种类型,其间老练是指安全有用性已在医疗实践中得到充沛证明的景象,全新是指未上市或安全有用性尚未在医疗实践中得到充沛证明的景象。人工智能医疗器械的算法、功用、用处若有一项为全新则归于全新类型,反之归于老练类型。

  人工智能医疗器械可一起选用多种、多个人工智能算法,在前处理、后处理进程中完结辅佐决议方案、非辅佐决议方案用处。因而,注册请求人需结合人工智能医疗器械的预期用处、运用场景、中心功用以及所用算法的类型特色、技能特征、组合办法展开相应产品质控作业,以确保产品的安全有用性。

  人工智能算法特别是依据数据的算法,具有快速迭代更新的特性。人工智能算法更新归于软件更新范畴,故遵从软件更新的根本准则及要求:人工智能算法更新若影响到人工智能医疗器械的安全性或有用性则归于严峻软件更新,应请求改动注册;反之,人工智能算法更新若未影响到人工智能医疗器械的安全性和有用性则归于细微软件更新,经过质量办理系统进行操控,无需请求改动注册,待下次改动注册时提交相应注册申报资料。

  人工智能算法更新可分为算法驱动型更新和数据驱动型更新。其间,算法驱动型更新是指人工智能医疗器械所用算法、算法结构、算法流程、算法编程结构(详见后文)、输入输出数据类型等发生改动,一般归于严峻软件更新。此外,算法从头练习即弃用原有练习数据而选用全新练习数据进行算法练习,亦归于算法驱动型更新。

  数据驱动型更新是指仅由练习数据量添加而发生的算法更新。数据驱动型更新是否归于严峻软件更新准则上以算法功用点评成果(依据相同的测验集和算法功用点评方针)为准,算法功用点评成果若发生显著性改动则归于严峻软件更新,即算法功用点评成果与前次注册(而非前次更新)比较存在核算学差异,反之归于细微软件更新。

  人工智能医疗器械其他类型的算法更新、软件更新以及严峻软件更新断定准则详见医疗器械软件辅导准则、医疗器械网络安全辅导准则。

  软件版别命名规矩准则上应包含算法驱动型更新和数据驱动型更新,清晰并区别严峻软件更新和细微软件更新,其间严峻软件更新罗列常见典型状况。软件版别命名规矩的根本要求详见医疗器械软件辅导准则、医疗器械网络安全辅导准则。

  人工智能技能从展开驱动要素视点是依据模型/数据和算力的算法,其间模型/数据是人工智能技能的根底,算力是人工智能技能的确保,算法是人工智能技能的中心。

  因为算力所用核算资源自身不归于监管方针,核算资源的监管要求取决于其所属的核算渠道类型。故从监管视点动身,人工智能医疗器械安全有用性点评依据其预期用处、运用场景、中心功用,以算法特性为中心要点重视其泛化才能,以模型/数据为根底要点重视其质控状况,一起从危险办理视点统筹算力缺乏与失效的影响。

  人工智能算法的类型不同,其算法特性、适用场景也不同,点评要点亦有所偏重;一起,不同类型的人工智能算法可组合运用,需结合各算法特性和算法组合办法进行全体点评。因而,注册请求人需结合人工智能医疗器械的预期用处、运用场景、中心功用挑选与之相适合的人工智能算法或算法组合,依据算法特性并结合危险办理展开相应验证与承认作业。

  以深度学习为例,其是指经过练习具有多个隐层的神经网络而取得输入输出映射联系的人工智能算法,亦是依据海量数据和高算力的黑盒算法,既可用于有监督学习又可用于无监督学习。因而,关于选用深度学习技能的人工智能医疗器械,依据其预期用处、运用场景、中心功用,要点重视其算法泛化才能、数据质控、可解释性等问题,一起,深度学习若与其他类型的人工智能算法组合运用,还需依据各算法特性要点重视算法组合的全体点评问题。

  人工智能新算法研讨处于深化展开阶段,如依据小样本数据、依据弱标示数据、依据非结构化数据、黑盒算法透明化等算法。人工智能医疗器械若运用人工智能新算法,亦需依据算法特性并结合危险办理展开相应验证与承认作业,以确保产品的安全有用性。

  人工智能医疗器械的危险水平亦可用软件安全性等级进行表述,软件安全性等级越高,其生计周期质控要求越严厉,注册申报资料越翔实,一起因为全新类型的潜在不知道危险多于老练类型,故需结合老练度予以归纳考虑,详细要求详见医疗器械软件辅导准则。

  人工智能医疗器械的软件安全性等级可依据产品的预期用处、运用场景、中心功用进行归纳断定,其间预期用处首要考虑用处类型、重要程度、急迫程度等要素,运用场景首要考虑运用场合、疾病特征、适用人群、方针用户等要素,中心功用首要考虑功用类型、中心算法、输入输出、接口等要素。亦可依据危险办理所承认的危险等级进行断定,软件安全性等级与危险等级的分级可以不同,但二者存在对应联系,因而可依据危险等级来断定软件安全性等级,但应在采纳危险操控办法之前进行断定。

  人工智能医疗器械的首要危险从算法视点包含过拟合和欠拟合,其间过拟合是指算法关于练习数据过度学习而将非普遍规律作为重要特征,欠拟合是算法关于练习数据学习不充沛而遗失重要特征,均会下降算法泛化才能。从用处视点,辅佐决议方案首要包含假阴性和假阳性,其间假阴性即漏诊,或许导致后续医治活动延误,特别是要考虑快速发展疾病的医治活动延误危险,而假阳性即误诊,或许导致后续不必要的医治活动;非辅佐决议方案从算法规划方针能否得以完结视点,亦可参阅辅佐决议计区分为假阴性和假阳性。此外,进口人工智能医疗器械还需考虑中外差异危险,如人种、流行病学特征、临床医治标准等差异。

  注册请求人应结合人工智能医疗器械的预期用处、运用场景、中心功用展开危险办理活动,采纳危险操控办法将危险降至可接受水平,并贯穿于人工智能医疗器械全生命周期进程。

  注册请求人应结合质量办理系统要求,参阅软件、人工智能相关标准和杰出工程实践,树立人工智能医疗器械生计周期进程,展开与软件安全性等级相匹配的产品质量确保作业,将危险办理、可追溯剖析贯穿于生计周期全程,构成记载以供系统核对。

  上市前展开充沛、适合、有用的验证与承认活动,确保算法泛化才能满意用户需求,辨认可预见危险并将其降至可接受水平,清晰产品运用约束(含技能约束,下同)和必要警示提示信息。上市后继续展开算法泛化才能研讨,一起结合用户投诉、不良事情和召回等状况辨认前期未预见的危险,并采纳有用的危险操控办法将危险降至可接受水平。此外,依据产品更新需求,经点评后施行更新活动,展开与之相适合的验证与承认活动,确保算法泛化才能继续满意用户需求。

  人工智能医疗器械生计周期(又称生命周期)进程可依据软件生计周期进程予以树立,详细要求详见医疗器械独立软件出产质量办理标准及其现场检查辅导准则。

  考虑到有监督深度学习是当时人工智能医疗器械的干流算法,故本辅导准则以有监督深度学习为例胪陈人工智能医疗器械生计周期进程质控要求,首要包含需求剖析、数据搜集、算法规划、验证与承认、更新操控等阶段。其他类型的人工智能算法可参照履行,不适用内容胪陈理由并予以记载。

  需求剖析以用户需求与危险为导向,结合产品的预期用处、运用场景、中心功用,归纳考虑法规、标准、用户、产品、数据、功用、功用、接口、用户界面、网络安全、警示提示等需求,要点考虑数据搜集、算法功用、运用约束等要求。

  为确保数据质量和操控数据偏倚,数据搜集需考虑数据来历的合规性、充沛性和多样性,数据散布的科学性和合理性,数据质控的充沛性、有用性和精确性。数据来历在合规性(如个人信息维护法)根底上确保充沛性和多样性,以进步算法泛化才能,例如:依据产品的预期用处和运用场景尽或许多搜集数据,如来历于多家、多地域、多层级的代表性临床组织,以及多家、多种、多参数的代表性搜集设备。数据散布的科学性和合理性需结合方针疾病流行病学特征予以考虑,包含但不限于疾病构成(如分型、分级、分期)、人群散布(如健康、患者,性别、年纪、作业、地域、生活办法)、核算方针(如发病率、患病率、治愈率、死亡率、生计率)等状况,以及方针疾病并发症与相似疾病的影响状况。数据质控的充沛性、有用性和精确性需结合数据搜集与数据标示的人员、设备、进程等影响要素予以考虑,详细要求详见后文。

  算法功用需结合医疗实践和产品定位,归纳考虑假阴性与假阳性、重复性与再现性、鲁棒性/健壮性、实时性等功用方针的适用性及其要求,统筹不同功用方针的约束联系,如假阴性与假阳性等。一起,结合当时医疗水平状况,考虑金标准或参阅标准的承认依据、完结办法和质控要求,以确保算法功用点评的精确性,必要时归入数据搜集进程。

  运用约束需考虑产品禁用、慎用等场景,精确表述产品运用场景,供给必要警示提示信息。

  数据搜集依据合规性要求,首要考虑数据搜集、数据收拾、数据标示、数据集构建等活动的质控要求,以确保数据质量和算法练习作用。

  数据搜集需考虑搜集设备、搜集进程、数据脱敏等质控要求,并树立数据搜集操作标准。数据搜集亦可运用历史数据,需结合样本规划、搜集难度等影响要素合理挑选数据搜集办法。若适用,数据搜集需经道德委员会同意。

  搜集设备质控包含搜集设备的兼容性和搜集特征等要求。兼容性依据数据生成办法(直接生成、直接生成)考虑搜集设备的兼容性要求,如搜集设备的称号、类型标准、制造商、功用方针等要求,若无需考虑兼容性要求胪陈理由并予以记载。搜集特征考虑搜集设备的搜集办法(如惯例成像、增强成像)、搜集协议(如MRI成像序列)、搜集参数(如CT加载电压、加载电流、加载时刻、层厚)、搜集精度(如分辨率、采样率)等要求。

  搜集进程质控包含人员办理、搜集流程、搜集质量点评等要求。人员办理考虑搜集人员、审阅人员的选拔(如职称、作业年限、作业经验、地点组织,若有国外人员则需清晰其资质要求)、练习(如练习资料、练习方案)、查核(如办法、频次、方针、经过准则、一致性)等要求。搜集流程考虑人员职责、搜集进程、成果审阅等要求。搜集质量点评考虑点评人员、点评办法、点评方针、经过准则等要求,并记载点评成果。

  数据搜集若运用历史数据,需列明搜集设备及搜集特征要求,并展开数据搜集质量点评作业。

  搜集的数据应进行数据脱敏以维护患者隐私,数据脱敏需清晰脱敏的类型(静态、动态)、规矩、办法以及脱敏内容的承认依据。

  脱敏数据汇总构成原始数据库,不同模态的数据在原始数据库中需加以区别(下同)。原始数据库需考虑样本规划的充沛性、样本多样性等问题。

  数据收拾依据原始数据库考虑数据清洗、数据预处理的质控要求。数据清洗需清晰清洗的规矩、办法、成果,数据预处理需清晰处理的办法(如滤波、增强、重采样、尺度裁剪、均一化等)、成果。数据收拾所用软件东西(含脚本,下同)均需清晰称号、类型标准、完好版别、制造商、运转环境,并进行软件承认。

  数据经收拾后构成根底数据库,需清晰样本类型、样本量、样本散布等信息。样本类型以适用人群为单位可分为单一数据、数据序列(由多个单一数据组成,如结构序列、功用序列、时刻序列)。样本量需考虑样本规划的充沛性,清晰样本总量及其承认依据。样本散布需考虑样本的科学性和合理性,依据适用人群、数据来历组织、搜集设备、样本类型等要素清晰疾病构成的数据散布状况。

  数据标示作为有监督学习数据质控的关键环节,需树立数据标示操作标准,清晰标示资源办理、标示进程质控、标示质量点评等要求。

  标示资源办理包含人员办理和根底设施办理。人员办理考虑标示人员、审阅人员和裁定人员的选拔(如职称、作业年限、作业经验、地点组织,若有国外人员则需清晰其资质要求)、练习(如练习资料、练习方案)、查核(如办法、频次、方针、经过准则、一致性)等要求。根底设施办理考虑标示场所(实在场所或模仿场所,模仿场所可依据产品实践状况调整模仿程度,胪陈调收拾由并予以记载)、标示环境条件(如空间、照明、温度、湿度、气压)、标示软件(称号、类型标准、完好版别、制造商、运转环境、软件承认)等要求。

  标示进程质控包含人员职责(如人员资质、人员数量、职责分工)、标示规矩(如临床攻略、专家一致、专家评议、文献剖析)、标示流程(如标示方针、标示办法、标示次序、标示进程、成果审阅)、不合处理(如裁定人员、裁定办法)、可追溯性(如数据、操作)等要求。

  标示质量点评包含点评人员、点评办法、点评方针、经过准则等要求,并记载点评成果。

  数据经标示后构成标示数据库,样本类型可分为数据块(如图画区域、数据片段)、单一数据(由多个数据块组成)、数据序列(由多个单一数据组成)。标示数据库的样本量、样本散布等要求及危险考量与根底数据库相同。

  数据标示可运用主动标示软件,但主动标示成果不得直接运用,应由标示人员审阅后方可运用;一起,主动标示软件亦需清晰称号、类型标准、完好版别、制造商、运转环境等信息,并进行软件承认。

  依据标示数据库构建练习集(用于算法练习)、调优集[2](若有,用于算法超参数调优)、测验集(用于算法功用点评),清晰练习集、调优集、测验集的区别办法、区别依据、数据分配份额。练习集准则上需确保样本散布具有均衡性,测验集、调优集准则上需确保样本散布契合实在状况,练习集、调优集、测验集的样本应两两无交集并经过查重予以验证。

  为处理样本散布不满意预期的问题,可对练习集、调优集小样本量数据进行扩增,准则上不得对测验集进行数据扩增,对立测验(详见后文)在外。数据扩增需清晰扩增的方针、规划、办法(离线、在线)、办法(如翻转、旋转、镜像、平移、缩放、滤波、生成对立网络等)、倍数,在线扩增亦需予以记载,扩增需考虑数据偏倚的影响及危险,如部分数据扩增倍数过大、数据扩增倍数不均衡等。若选用生成对立网络(详见后文)进行数据扩增,需清晰算法根本信息以及算法选用依据。

  数据经扩增后构成扩增数据库,需列表比照扩增数据库与标示数据库在样本量、样本散布(注明扩增倍数)等差异,以证明扩增数据库样本量的充沛性以及样本散布的合理性。

  人工智能算法作为人工智能医疗器械的中心,其规划首要考虑算法挑选、算法练习、算法功用点评等要求。关于黑盒算法,算法规划应展开算法功用影响要素剖析,一起主张与现有医学知识[3]树立相关,以进步算法可解释性。

  算法挑选供给所用算法的称号、类型(如有监督学习、无监督学习,依据模型、依据数据,白盒、黑盒)、结构(如层数、参数规划)、输入输出数据类型、流程图、算法编程结构、运转环境等根本信息,并清晰算法选用依据,包含选用的理由和根本准则。

  若组合运用集成学习、搬迁学习、强化学习等,亦需供给算法根本信息以及算法选用依据,详见后文。

  算法练习需依据练习集、调优集进行练习和调优,考虑点评方针、练习办法、练习方针、调优办法、练习数据量-点评方针曲线等要求。

  点评方针主张依据用户需求进行挑选,辅佐决议方案可挑选敏感性、特异性等方针,非辅佐决议方案可挑选图画质量、丈量精确性等方针。练习办法包含但不限于留出法和穿插验证法,若组合运用联邦学习(详见后文)亦需清晰算法选用依据,并供给算法根本信息。练习方针依据医疗状况胪陈方针承认依据,供给受试者作业特征(ROC)曲线或其衍生曲线、混杂矩阵及其衍生参数等依据予以证明。调优办法清晰优化战略和完结办法。练习数据量-点评方针曲线用于证明算法练习的充沛性和有用性,若无法供给则需胪陈理由并供给代替依据。

  算法功用点评作为软件验证的重要组成部分,需依据测验集对算法规划成果进行点评,归纳考虑假阴性与假阳性、重复性与再现性、鲁棒性/健壮性、实时性等适用点评要求,以证明算法功用满意算法规划方针,并作为软件验证、软件承认的根底。亦可依据第三方数据库(详见后文)展开算法功用点评。

  一起,展开算法功用影响要素剖析以进步算法可解释性,胪陈影响算法功用的首要要素及其影响程度,如搜集设备、搜集参数、疾病构成、病变特征等要素,依据剖析成果清晰产品运用约束和必要警示提示信息。

  此外,依据产品实践状况展开压力测验(详见后文)、对立测验等测验,以全面深化点评算法功用。

  软件验证是指经过供给客观依据承认软件开发、软件更新某一阶段的输出满意输入要求,包含软件验证测验(单元测验、集成测验、系统测验)、规划评定等系列活动。

  软件验证依据软件需求予以展开,确保软件的安全有用性,并作为软件承认的根底。

  软件承认是指经过供给客观依据承认软件满意用户需求和预期意图,包含软件承认测验(用户测验)、临床点评、规划评定等系列活动。依据产品实践状况,软件承认办法可单一运用,亦可组合运用。

  软件承认测验依据用户需求,由预期用户在实在或模仿运用场景下予以展开,亦可依据测评数据库(详见后文)予以展开。

  临床点评根本准则详见医疗器械软件辅导准则,依据中心功用或中心算法,结合预期用处和老练度予以归纳考虑:非辅佐决议方案类功用依据中心功用展开同种类医疗器械比对,全新的功用、算法和用处准则上均需展开临床点评;辅佐决议方案类功用依据中心算法展开同种类医疗器械比对,所选同种类医疗器械的临床依据准则上需依据临床试验(含回忆性研讨,下同),全新的功用、算法和用处准则上均需展开临床试验。详细要求详见医疗器械临床点评等通用辅导准则,以及人工智能医疗器械临床点评等专用辅导准则。

  一起,展开算法功用比较剖析,若各类测验场景(含临床点评)算法功用变异度较大,胪陈原因并依据剖析成果清晰产品运用约束和必要警示提示信息。

  最终,结合算法练习、算法功用点评、临床点评等成果展开算法功用归纳点评,针对练习样本量和测验样本量过少、测验成果显着低于算法规划方针、算法功用变异度过大等状况,对产品的适用规划、运用场景、中心功用进行必要约束。

  人工智能医疗器械若发生算法更新、软件更新,均应当依照质量办理系统的要求,展开与算法更新、软件更新的类型、内容和程度相适合的验证与承认活动,将危险办理、可追溯剖析贯穿于更新全程,构成记载以供系统核对。

  关于算法更新,不管算法驱动型更新仍是数据驱动型更新,均应展开相应验证与承认活动,如算法功用点评、临床点评等,以确保算法更新的安全有用性。关于软件更新,详细要求详见医疗器械软件辅导准则、医疗器械独立软件出产质量现场检查辅导准则。

  此外,算法更新、软件更新均需考虑引进回滚机制,以确保医疗事务的连续性,特别是对危险较高的软件。

  总归,人工智能医疗器械所含的每个人工智能算法或算法组合,均需独立展开需求剖析、数据搜集、算法规划、验证与承认、更新操控等活动,一起考虑人工智能算法组合的全体点评要求,以确保产品的安全有用性。

  前期已开发的人工智能医疗器械若不满意本辅导准则的适用要求,应展开距离剖析并予以记载,清晰产品运用约束和必要警示提示信息。必要时采纳补救办法,以满意质量办理系统要求,并确保产品的安全有用性。

  人工智能医疗器械的注册单元与检测单元区别准则详见医疗器械软件辅导准则,人工智能独立软件、人工智能软件组件别离参照独立软件、软件组件的要求。

  若软件中心功用(即软件在预期运用场景完结预期用处所必需的功用)相同,但中心算法(即完结软件中心功用所必需的算法)类型不同,则每类中心算法所对应的中心功用均需检测,即检测方针为中心功用而非中心算法。

  人工智能医疗器械需结合预期用处、运用场景、中心功用,依据保密性、完好性、可得性等网络安全特性,承认网络安全才能建造要求,以应对网络进犯和数据盗取等网络要挟,如算法编程结构缝隙进犯、数据污染等。详细要求详见医疗器械网络安全辅导准则。

  除此之外,还需在人工智能医疗器械全生命周期进程中考虑数据安全问题,包含上市前规划开发阶段和上市后运用阶段。数据搬运需清晰搬运办法、数据污染防护办法、数据毁掉等要求。数据收拾、数据集构建、算法练习、算法功用点评、软件验证等内部活动需在封闭或受控的网络环境下展开以避免数据污染。数据标示、软件承认等触及外方的活动需清晰数据污染防护办法,特别是在敞开网络环境下。各数据库(集)均需进行数据备份,清晰备份的办法、频次、数据康复办法。数据搜集、上市后运用需考虑医疗组织关于网络安全与数据安全的接口要求。

  人工智能医疗器械若运用移动核算、云核算等技能,则遵从相关辅导准则要求。详细而言,移动核算相关要求详见移动医疗器械辅导准则,云核算相关要求详见医疗器械软件辅导准则,移动核算与云核算的网络安全相关要求详见医疗器械网络安全辅导准则。

  主张加强人工智能医疗器械的人因规划以进步可用性,将用户过错运用的危险降至可接受水平,特别是软件用户界面。详细要求详见医疗器械人因规划相关辅导准则。

  本辅导准则所述压力测验[4]是指选用稀有或特别的实在数据样本展开的算法功用测验,偏重于点评算法泛化才能的极限。

  注册请求人需依据产品实践状况展开压力测验,以全面深化点评算法功用,必要时可引进对立样本展开对立压力测验。若未展开相应测验或测验成果欠安,均需对产品的适用规划、运用场景、中心功用进行必要约束,并在阐明书中清晰产品运用约束和必要警示提示信息。

  本辅导准则所述对立测验是指依据实在数据样本运用数据扰动、生成对立网络等技能发生对立样本,并选用对立样本展开的算法功用测验,偏重于点评算法的鲁棒性/健壮性。

  若条件具有,主张注册请求人展开对立测验,以全面深化点评算法功用。若未展开相应测验或测验成果欠安,均需清晰产品运用约束和必要警示提示信息。

  第三方数据库可用于算法功用点评,但其类型、用处等状况各不相同,未必可以彻底满意软件承认测验的要求。因而,运用第三方数据库进行软件承认测验,需点评其满意软件承认测验的充沛性、适合性和有用性。

  可用于软件承认测验的第三方数据库即为测评数据库。测评数据库除满意数据库通用要求(如数据办理、网络安全与数据安全、可扩展性)外,还应满意以下专用要求。

  1.权威性:测评数据库的数据搜集、数据标示及其质控作业由相应临床专业范畴的权威组织(如国家临床医学研讨中心等)担任,以确保数据精确性;标示人员、审阅人员、裁定人员需具有与其岗位职责相匹配的临床实践经验,以确保数据质量。

  2.科学性:测评数据库的数据样本均为临床实在数据,不得进行数据扩增;样本散布契合方针疾病流行病学特征状况,样本总量依据方针疾病流行病学核算方针、测验抽样误差操控要求,经过核算学核算予以承认;单次测验准则上依据测评数据库样本散布状况等份额随机抽取测验样本,且其样本量满意测验抽样误差操控要求。

  3.标准性:测评数据库的数据搜集、数据脱敏、数据清洗、数据预处理、数据标示、数据替换、数据办理、数据安全确保、数据备份等数据办理活动以及测评活动均需树立质控程序文件,并满意可追溯性要求。

  4.多样性:测评数据库的样本需来历于多家、多地域、多层级的代表性临床组织以及多家、多种、多参数的代表性搜集设备,以确保数据多样功用够满意算法泛化才能点评要求;若条件具有,测评数据库可包含恰当份额的稀有或特别的临床实在数据样本,以便展开压力测验深化点评算法泛化才能的极限。

  5.封闭性:测评数据库需封闭办理,样本总量需远大于单次测验样本量,测评活动亦需封闭办理,以确保算法功用点评的客观性、公正性、公平性。

  6.动态性:测评数据库需定时弥补或替换必定份额的数据样本,以确保其具有继续的科学性、多样性和封闭性以及数据的时效性;数据弥补或替换的频率、份额需有承认依据,并满意标准性要求。替换出库的数据样本由测评数据库职责方自行承认其处理方案。

  依据测评数据库,运用数据扰动、生成对立网络等技能,可衍生出对立测评数据库。若条件具有,主张依据测评数据库建造对立测评数据库,以全面深化点评算法功用。

  注册请求人可依据上述专用要求对第三方数据库进行挑选,若第三方数据库能用作测评数据库(含对立测评数据库,下同)则可用于软件承认测验,并在产品注册申报时按医疗器械主文档挂号事项要求提交测评数据库点评资料。

  揭露数据库因不具有封闭性而不能用作测评数据库,但可用于算法功用点评,若用于算法练习需从头进行质量点评。运用揭露数据库需依据其运用状况展开必要点评作业,并在注册申报资猜中予以阐明。

  其他类型第三方数据库可参照测评数据库和揭露数据库的要求予以运用,一起考虑其适用场景、数据质量点评、时效性等要求。

  白盒算法的特征提取需求人为干涉,可与现有医学知识树立相关,可解释性高,一般为依据模型的算法。

  关于此类算法,有监督学习的模型/数据质控要求参照有监督深度学习履行,不适用内容胪陈理由并予以记载。同理,无监督学习的模型/数据质控要求亦参照有监督深度学习履行,其间数据标示不适用,其他不适用内容胪陈理由并予以记载。

  此类算法不管有监督学习仍是无监督学习,均需清晰特征信息,如特征分类(如人口核算学、生物学、形状学)、特征特点(如形状、纹路、性质、尺度、鸿沟)、特征展示办法(如形状、尺度、鸿沟、色彩、数量)等信息。

  集成学习是指发生多个基学习器并以某种结合战略将基学习器进行集成的人工智能算法。集成学习从不同视点具有不同类型区别维度,如同质和异质的基学习器集成算法、串行和并行的集成算法等,并可与深度学习等人工智能算法组合运用。

  人工智能医疗器械若运用集成学习算法,注册申报资料需清晰算法的称号、类型、输入输出、流程图、运转环境等根本信息以及算法选用依据,并依据集成学习类型及其算法特性供给算法验证与承认资料。

  搬迁学习是指将在某范畴或使命学习到的模型应用于不同但相关的范畴或使命的人工智能算法,如将在天然图画范畴学习构成的模型应用于医学图画范畴。搬迁学习首要包含依据特征和依据模型的算法,并可与深度学习、联邦学习等人工智能算法组合运用。

  人工智能医疗器械若运用搬迁学习算法,注册申报资料需清晰算法的称号、类型、输入输出、流程图、运转环境等根本信息以及算法选用依据,并依据搬迁学习的类型及其算法特性供给预练习模型的数据集构建、算法测验等资料。

  强化学习是指依据举动与环境的交互,完结举动从环境所获累积奖赏最大化的人工智能算法,选用“试错”的学习战略。强化学习从不同视点具有不同类型区别维度,如有模型与无模型的算法、依据战略和依据价值的算法等,并可与深度学习等人工智能算法组合运用。

  人工智能医疗器械若运用强化学习算法,注册申报资料需清晰算法的称号、类型、输入输出、流程图、运转环境等根本信息以及算法选用依据,并依据强化学习类型及其算法特性供给算法验证与承认资料。

  联邦学习是依据多个数据源协同树立学习模型的人工智能算法,即每个数据源独立进行本地数据学习,经过交流数据模型一起树立学习模型,实为散布式算法练习技能,亦归于隐私核算技能。联邦学习首要包含横向联邦(依据样本)和纵向联邦(依据特征)等算法,并可与搬迁学习等人工智能算法组合运用。

  人工智能医疗器械若运用联邦学习算法等隐私核算技能进行算法练习,注册申报资料需清晰算法的称号、类型、输入输出、流程图、运转环境等根本信息以及算法选用依据,并依据联邦学习等隐私核算技能的算法类型及其算法特性供给算法验证与承认资料。

  生成对立网络是经过生成器和判别器的相互博弈学习而发生与实在数据相似样本的人工智能算法,首要用于数据扩增、对立测验的样本生成(详见前文),并可与深度学习等人工智能算法组合运用。

  人工智能医疗器械若运用生成对立网络进行数据扩增、对立样本生成,注册申报资料需清晰算法的称号、类型、输入输出、流程图、运转环境等根本信息以及算法选用依据,并依据生成对立网络类型及其算法特性供给算法测验资料。此刻,主张展开对立测验。

  继续学习/自适应学习具有自学习才能,布置后可经过继续学习用户数据而进行产品快速更新。此刻,用户亦成为产品开发者,与注册请求人一起承当产品质量职责和法律职责;一起,此种更新关于产品安全有用性的影响具有高度不承认性,特别是依据数据的无监督学习。

  因而,在当时法律法规系统和技能水平条件下,继续学习/自适应学习应封闭自学习功用,或许虽敞开自学习功用但不得投入运用,即用户一直运用产品原有功用,自学习功用仅用于算法练习或医学科研。

  注册请求人应依照质量办理系统要求,对自学习功用所发生的产品更新的安全有用性进行验证与承认,必要时请求改动注册,待同意后方能将自学习功用所发生的产品更新投入运用。

  人工智能算法编程结构(以下简称算法结构)从开发者视点可分为自研算法结构和现成算法结构,其间自研算法结构即注册请求人自行研制的人工智能算法结构,归于自研软件;现成算法结构是指注册请求人所运用的由第三方开发的人工智能算法结构,视为现成软件,现成算法结构开发者视为医疗器械供货商。

  算法结构更新包含产品更新(即替换算法结构)、版别更新、补丁更新,其间产品更新、非功率型版别更新关于人工智能医疗器械而言归于严峻软件更新,功率型版别更新(即运算功率单纯进步)、补丁更新关于人工智能医疗器械而言一般归于细微软件更新,除非影响到人工智能医疗器械的安全性或有用性。算法结构一起发生多种类型的更新,相同遵从危险从高准则。

  算法结构可参照自研软件、现成软件相关要求提交相应注册申报资料,均需清晰算法结构的称号、类型(自研算法结构、现成算法结构)、类型标准、完好版别、制造商等信息。算法结构若依据云核算渠道,相关要求详见前文关于云核算的要求。

  人工智能芯片作为核算资源的组成部分,自身不归于监管方针,依据其所属的核算渠道类型考虑监管要求。关于人工智能独立软件,人工智能芯片作为通用核算渠道的组成部分,不归于产品结构组成,依照运转环境予以考虑。关于人工智能软件组件,人工智能芯片作为医用核算渠道的组成部分,归于产品结构组成,与产品进行全体点评。

  不管何种状况,运用人工智能芯片均需在注册申报资猜中清晰其称号、类型标准、制造商、功用方针等信息。

  算法研讨陈述适用于人工智能算法或算法组合的初度发布和再次发布,包含算法根本信息、算法危险办理、算法需求标准、数据质控、算法练习、算法验证与承认、算法可追溯性剖析、定论等内容,不适用内容胪陈理由。

  清晰算法的称号、类型、结构、输入输出、流程图、算法结构、运转环境等根本信息以及算法选用依据。

  其间,算法类型从学习战略、学习办法、可解释性等视点清晰算法特性。算法结构清晰算法的层数、参数规划等超参数信息。算法结构清晰所用人工智能算法结构的根本信息,包含称号、类型(自研算法结构、现成算法结构)、类型标准、完好版别、制造商等信息;若依据云核算渠道,清晰云核算的称号、服务形式、布置形式、装备以及云服务商的称号、居处、服务资质。运转环境清晰算法正常运转所需的典型运转环境,包含硬件装备、外部软件环境、网络条件;若运用人工智能芯片需清晰其称号、类型标准、制造商、功用方针等信息。算法选用依据胪陈人工智能算法或算法组合选用的理由和根本准则。

  清晰算法的软件安全性等级(细微、中等、严峻)并胪陈断定理由。供给算法危险办理资料,清晰过拟合与欠拟合、假阴性与假阳性、数据污染与数据偏倚(如数据扩增)等危险的操控办法。若无独自文档可供给软件危险办理资料,并注明算法危险办理地点位置。

  供给算法需求标准文档,若无独自文档可供给软件需求标准,并注明算法需求地点位置。

  供给数据来历合规性声明,列明数据来历组织的称号、地点地域、数据搜集量、道德批件(或科研协作协议)编号等信息。

  供给数据搜集操作标准文档,依据数据搜集办法清晰搜集设备、搜集进程、数据脱敏等质控要求。

  供给数据标示操作标准文档,清晰标示资源办理、标示进程质控、标示质量点评、数据安全确保等要求。

  依据适用人群、数据来历组织、搜集设备、样本类型等要素,供给原始数据库、根底数据库、标示数据库、扩增数据库关于疾病构成的数据散布状况。

  若数据来自揭露数据库,供给揭露数据库的根本信息(如称号、创建者、数据总量等)和运用状况(如数据运用量、数据质量点评、数据散布等)。

  依据适用人群、数据来历组织、搜集设备、样本类型等要素,供给练习集、调优集(若有)关于疾病构成的数据散布状况。

  清晰算法练习所用的点评方针、练习办法、练习方针、调优办法(若有),供给ROC曲线或混杂矩阵等依据证明练习方针满意医疗要求,供给练习数据量-点评方针曲线等依据以证明算法练习的充沛性和有用性。

  依据适用人群、数据来历组织、搜集设备、样本类型等要素,供给测验集关于疾病构成的数据散布状况。

  供给假阴性与假阳性、重复性与再现性、鲁棒性/健壮性、实时性等适用方针的算法功用点评成果,以证明算法功用满意算法规划方针。

  若运用第三方数据库展开算法功用点评,供给第三方数据库的根本信息(如称号、创建者、数据总量等)和运用状况(如测验数据样本量、点评方针、点评成果等)。

  若适用,供给算法功用影响要素剖析陈述,清晰影响算法功用的首要要素及其影响程度,以及产品运用约束和必要警示提示信息。

  若适用,供给压力测验、对立测验等测验陈述。若未展开相应测验或测验成果欠安,均需清晰产品运用约束和必要警示提示信息。

  若依据测评数据库进行算法承认,供给测评数据库的根本信息(如称号、创建者、数据总量等)、点评状况(如点评办法、点评方针、点评成果等)、运用状况(如点评方针、点评成果等)。若依据临床点评办法进行算法承认,指向临床点评资料即可。

  供给上述各类测验场景(含临床点评)下的算法功用点评成果比较剖析陈述,清晰产品运用约束和必要警示提示信息。

  供给算法可追溯性剖析陈述,即追溯算法需求、算法规划、源代码(清晰软件单元称号即可)、算法测验、算法危险办理的联系表。

  若无独自文档可供给软件可追溯性剖析陈述,并注明算法可追溯性剖析地点位置。

  简述算法功用归纳点评成果,清晰对产品的适用规划、运用场景、中心功用所做的必要约束,并断定人工智能算法或算法组合的安全有用性是否满意要求。

  算法更新研讨陈述仅适用于人工智能算法或算法组合的再次发布,在算法研讨陈述相应内容中清晰算法更新状况。

  其间,算法根本信息描绘申报算法状况,若适用胪陈与前次注册比较的改变状况;算法危险办理、算法需求标准、数据质控、算法练习、算法验证与承认、算法可追溯性剖析描绘算法更新的详细状况;定论简述算法功用归纳点评成果,并断定人工智能算法或算法组合更新的安全有用性是否满意要求。

  考虑到算法更新具有累积效应,算法更新研讨陈述需包含人工智能医疗器械自前次注册(连续注册在外)以来算法更新的全部内容。

  注册申报资料在契合医疗器械注册申报资料要求等文件要求根底上,满意医疗器械软件、医疗器械网络安全、移动医疗器械等相关辅导准则要求,一起要点重视以下要求。

  产品称号应契合通用称号命名标准要求,一般表现输入数据(如CT图画、眼底相片)、方针疾病(含病变、疾病的特点)、预期用处(如辅佐分诊、辅佐点评、辅佐检测、辅佐确诊)等特征词。

  结构组成所述功用模块需确保用语的标准性,若选用人工智能算法需表现中心算法称号,如深度学习等。

  适用规划依据预期用处、运用场景、中心功用予以标准,如处理方针、方针疾病、医疗用处、适用人群、方针用户、运用场所、搜集设备要求、运用约束等。

  人工智能软件组件一般无需在注册证载明信息中表现。其软件功用称号可参照人工智能独立软件要求。若有辅佐决议方案类软件功用,结构组成(若适用)和适用规划需予以表现。

  关于软件安全性等级为中等、严峻等级的产品,全新类型在软件研讨资猜中以算法为单位,提交每个人工智能算法或算法组合的算法研讨陈述,详细要求详见第六章;老练类型在软件研讨资猜中清晰算法根本信息即可,无需供给算法研讨资料。

  关于软件安全性等级为细微等级的产品,在软件研讨资猜中清晰算法根本信息即可,无需供给算法研讨资料。

  关于软件安全性等级为严峻等级、预期由患者运用或在底层医疗组织运用的产品,准则上需独自供给一份用户练习方案,包含用户练习的方案、资料、办法、师资等。

  产品技能要求若含有依据测评数据库测验的功用方针,需在“附录”中清晰测评数据库的根本信息(如称号、类型标准、完好版别、职责方、主文档挂号编号等)。

  依据其他类型第三方数据库测验的功用方针,准则上无需在产品技能要求中表现。

  依据算法功用归纳点评成果,对产品的适用规划、运用场景、中心功用进行必要约束,并在阐明书中清晰产品运用约束和必要警示提示信息。若适用,清晰数据搜集设备和数据搜集进程相关要求。

  关于辅佐决议方案类产品,阐明书需清晰人工智能算法的算法功用点评总结(测验集根本信息、点评方针与成果)、临床点评总结(临床数据根本信息、点评方针与成果)、决议方案方针界说(或供给决议方案方针界说所依据的临床攻略、专家一致等参阅文献)等信息。此刻若选用依据数据的人工智能算法,阐明书还需弥补算法练习总结信息(练习集根本信息、练习方针与成果)。

  若产品选用人工智能黑盒算法,则需依据算法影响要素剖析陈述,在阐明书中清晰产品运用约束和必要警示提示信息。

  关于软件安全性等级为中等、严峻等级的产品,全新类型在软件研讨资猜中以算法为单位,依据人工智能算法的更新状况,提交每个人工智能算法或算法组合的算法更新研讨陈述(或算法研讨陈述),详细要求详见第六章;老练类型在软件研讨资猜中清晰算法根本信息即可,无需供给算法研讨资料。

  关于软件安全性等级为细微等级的产品,在软件研讨资猜中清晰算法根本信息即可,无需供给算法研讨资料。

  连续注册一般无需提交算法相关研讨资料。若适用,依据注册证“补白”所载明的要求提交相应算法研讨资料。回来搜狐,检查更多

上一篇:人工智能的三大学派 下一篇:留学专家浅析人工智能类专业名校