《食品安全风险评估统计模型及软件开发解析.ppt》由会员分享,可在线阅读,更多相关《食品安全风险评估统计模型及软件开发解析.ppt(66页珍藏版)》请在三一办公上搜索。
1、2023/10/5,1,食品安全风险评估统计模型及软件开发,2023/10/5,2,风险评估及统计模型 CDEEM 构建原理及数据库 CDEEM 软件及评估结果CDEEM 验证与评价,主 要 内 容,2023/10/5,3,食品安全的2个策略,零风险选择,即“黑与白”的方法“凡是对人和动物有致癌作用的化学物不得加入食品”(Delancy修正案)100%安全与零风险,人的生命与健康最重要、不惜代价风险分析“Every substance is a poison it is only a matter of dose”(Paracelsus)没有100%安全的食品,仅能将风险渐低到可接受水平,大多
2、数人支持,难以理解!,2023/10/5,4,风险评估(Risk Assessment)框架,4.风险表征 Risk characterisation,危害鉴定 Hazard identification,2.危害表征Hazard characterisation,3.膳食暴露Dietary exposure,国际标准的制定依赖暴露评估数据(发达国家主导)不同国家食物消费量与食品污染水平不同成员国有权制定与国际标准不一致的国家标准国际标准不一定适合特定食物消费量与污染水平标准的设立是保护大多数人,而不是平均人暴露评估不是均数简单计算,需进行高暴露 水平和特殊人群评估(大数据库),发展中国家必须
3、开展并重视的研究,2023/10/5,5,现有技术标准现状,膳食暴露评估方法对于获得的膳食污染物数据必须与食物消费量结合,暴露评估有三种方法:以食品污染水平和食物消费量均为事前进行估计的简单点评估模型;以污染物水平进行事前估计乘以食物消费量分布数据的分布点评估模型;以污染物和消费量均为分布数据的随机概率评估模型。,2023/10/5,6,传统方法(非概率模型),点评估:固定食品消费量 固定污染水平=摄入量 平均暴露量=食物消费均值 食物污染中位水平 高端暴露量=高端食品消费量 高污染水平不能提供暴露量的可能范围,通常是保守的估计,作为筛选目的.分布模型:食品消费量分布数据X固定污染水平=摄入量
4、范围(特定消费模式)比点估计更加精确,但因取决于假设仍属于保守。点评估和简单分布方法趋向用“最坏情况”假设,而不考虑化学物在食品中存在的概率,不同食品中化学物的污染水平不同,或者食物消费量不同。,2023/10/5,7,污染物数据库,消费量和残留数据随机采样,暴露量=消费量i X 污染水平i,点评估 概率模型 简单到复杂 解决估计数据的不确定性问题 风险管理从意义不大到十分有意义过度 避免了点评估中的争论和对于实际摄入量过高估计,概率模型分析,消费量数据库,2023/10/5,8,从点评估到概率分析,2023/10/5,9,国外研究进展,欧盟:FP5,“随机化模拟人类对化学物和营养素暴露的开
5、发、验证和应用”FP6,“发展全新整合的食品风险分析确保食品安全”概率性暴露评估Probabilistic Exposure Assessment急性暴露与慢性暴露风险Acute and Chronic risks美国:一些主要概率评价模型,2023/10/5,10,SHEDS 模型 Stochastic Human Exposure and Dose Simulation(SHEDS)Model,2023/10/5,11,中国开展的暴露评估,食物消费量数据:全国营养调查(1959,1982,1992,2002)食品污染水平数据污染物监测网、总膳食研究(1990,1992,2000)、双份饭研
6、究。人体组织/体液的直接监测,如母乳中有机氯化合物、二噁英的浓度。2002年中国居民营养与健康状况调查分层多阶段等容整群随机抽样方法膳食调查:食品频数法、3天24小时回顾法、3天入户称重法。,2023/10/5,12,国内研究现状,我国在卫生标准起草过程中,已经利用我国膳食营养调查提出的食物消费量模式和食品污染物现状调查,利用点评估技术进行暴露评估,提出我国的限量标准指标以及在采用国际标准时通过暴露评估评价限量标准指标的适用性,但这一过程属于筛选性质的多,进行定量暴露评估的较少,与国际水平存在一定差距。1990年、1992年和2000年成功进行的3次“中国总膳食研究”,在研究内容的完整性和研究
7、方法的科学性上已基本接近发达国家水平。但在将危险性评估理论和数理统计、计算机技术相结合,开展膳食暴露定量评估模型研究上却要落后和迟缓一些。,2023/10/5,13,风险评估统计模型,点估计 IESTI概率模型:急性:慢性:,“理想”条件下的概率模型:,实际应用的概率模型:,2023/10/5,14,IESTI(International Estimate of Short Term Intake),由世界粮农组织和世界卫生组织农药残留专家联席会议(JMPR)确定的欧盟及国际权威机构在制定农残最大限量标准(MRL)时计算农药急性暴露量所采用的方法。它主要是针对一天内摄入可能引起急性反应的农药,
8、以食品为对象,选取某食品消费人群的高端消费量和食品污染物监测样本中的高残留量计算24小时内膳食暴露量,与急性参考剂量比较进行评估。为解决单位食品个体间的残留差异,引入了单位重量和变异因子两个概念。,2023/10/5,15,LP:高端消费量,摄食者消费量的P97.5,即能涵盖消费人群中97.5%的食用者每天的消费量;HR:高残留量,食品污染物监测的各检测样品的最大残留浓度值;U:食品单位重量,由污染物监测实验提供的单位食品重量的中位数;V:变异因子,单位食品高端残留量(P97.5)与检测样品的平均残留量的比值;P:加工因子,加工后食品中的污染物残留浓度与加工前原始农产品中污染物浓度的比值;bw
9、:消费人群的平均体重。,参数解释,2023/10/5,16,情形1食品单位重量小于25,如原始或经加工的农产品(谷物、小麦、油料种子及豆类等小粒农作物);这种情况也适用于肉类食品、蛋类、肝脏、肾脏等可食动物内脏类食品。,四种情形(情形1、2a、2b 和3),2023/10/5,17,食品单位重量大于25g,引入一个变异因子。情形2a 单位食品重量小于消费人群的每日高端消费量LP。如:桃、李等水果。假设个体一天内消费多于1个单位重量的某食品,且第一个单位重量的该食品残留水平为 HR v,其余为HR。情形2b 单位食品重量超过消费人群的每日高端消费量LP。如:大西瓜、大白菜等。假设个体一天内仅消费
10、小于等于1个单位重量的某食品,且消费部分残留水平为 HR v。,情形2,2023/10/5,18,对于散装或多种成分混合的加工食品,如果汁、牛奶等,以监测实验获得的各检测样品残留浓度的中位数STMR代表可能的最高残留浓度。,情形3,2023/10/5,19,WHO收集了一些国家部分水果、蔬菜等食品的单位重量信息(表1)。,食品的单位重量,2023/10/5,20,变异因子的引入是为了解决混合样品中食品个体间的残留差异。单个水果中的最高残留浓度可能要比混合样品高5-10倍。目前,关于变异因子的研究和讨论还在进行。,变异因子,2023/10/5,21,概率模型,概率法对所评价化学物在食品中存在概率
11、与污染水平(浓度)及相关水平的消费量进行模拟。这种方法需要足够的食品中化学物浓度和食物消费量数据,评价才有意义。通常情况下,法定的市场监督检查并不能提供统计学上有意义的分布特征。如果所获资料质量有保证,概率方法可能是最合适的方法:通过科学的抽样,将食物中某化学物浓度与实际含有该物质的食品消费量结合起来,从而提供了一个真实的暴露评价基础,来估计某物质的暴露量是否超过预定的安全阈值。是否对食物消费量数据和污染物监测数据进行分布拟合:参数方法:用适当的理论分布对数据进行拟合 非参数方法:直接根据样本的经验分布(大样本),2023/10/5,22,参数法与非参数法的选择,2023/10/5,23,以急
12、性暴露评估为例建模,污染物浓度模型非参:从现有数据随机抽样(经验分布)参数:二项分布/对数正态分布处理效应(加工因子)模型非参:无(1);固定(fk,nom,fk,upp)参数:对数或logit转换后正态分布 变异性建模非参:默认(按单位重量:,)参数:贝塔模型、贝努力模型、对数正态模型,2023/10/5,24,变异Variability=在人群间真正存在的差异,是真实性的部分。,不确定度Uncertainty=缺乏知识或数据信息造成的测量值与真实值差别,原则上可能降低,解决变异与不确定性难点:,Monte Carlo方法量化变异性,Bootstrap方法量化不确定性,2023/10/5,2
13、5,Monte Carlo方法,基本思想:以一个概率模型为基础,按照这个模型所描绘的过程,通过模拟实验结果,得出问题的近似解,即进行一种数字模拟实验。三个主要步骤:构造或描述概率过程;实现从已知概率分布抽样;建立各种估计量。一般而言,对模拟次数M有一定要求,模拟次数较少,结果可能不稳定。,2023/10/5,26,Bootstrap方法,以原始数据为基础进行有放回抽样的统计模拟方法,可用于研究一组数据某统计量的分布特征,适用于难以用常规方法解决的参数区间估计、假设检验等问题。基本思想是:从样本含量为n的原始数据范围内有放回地随机抽取i(通常选取i n)个观察单位组成一个样本,每个观察单位每次被
14、抽到的概率相等,所得样本称为Bootstrap样本。重复该过程若干次,记为B,所得B个Bootstrap样本均可看作是从相应经验分布中随机抽取而来。对于每个Bootstrap样本进行相关统计量(如p50、p95、p99)计算,就得到统计量的Bootstrap分布,它表示从总体中抽样获得的样本统计量的不确定性。,2023/10/5,27,模型原理,定量模型的变异性(图1)估计模型的不确定度(图2),2023/10/5,28,1,2,3,4,膳食调查数据库及结构,污染物监测数据库及结构,农产品的编码及分类,膳食数据与污染物数据整合,模型数据基础,2023/10/5,29,膳食量数据库:2002年中
15、国居民营养与健康状况调查中通过24小时膳食回顾法收集的有效数据,包括22567个家庭66172人连续3天共计193814人日、1810703条膳食量记录;人口学数据库:2002年中国居民营养与健康状况调查家庭成员基本情况登记表收集的数据,主要提供年龄、性别、体重等信息。,膳食调查数据库,2023/10/5,30,2023/10/5,31,flag 说明:,2023/10/5,32,2000-2006年全国污染物监测数据中,有效数据包括监测了497种食物,75种污染物,399032条记录。2005-2006年海关农产品进出口监测数据,有效数据包括监测了44种食物,104种污染物,88843条记录
16、。污染物总数据库合计监测了510种食物,135种污染物,487875条记录。,污染物监测数据库,2023/10/5,33,2023/10/5,34,中国食品污染物暴露评估与国际接轨的基础实现污染物数据库与膳食调查数据库关联的重要途径识别同一食品不同表达的唯一符号,便于后续计算机处理。,农产品编码及分类,2023/10/5,35,食物编码主要参考四个国内外文件:Pesticides Residues in Food,Second Edition,Section 2,Codex Alimentarius Volume 2,1993.GEMS/FOOD Consumption Cluster Die
17、ts.杨月欣 王光亚 潘兴昌.中国食物成份表2002 北京大学医学院出版社杨月欣 王光亚 潘兴昌.中国食物成份表2004 北京大学医学院出版社,编码总则,2023/10/5,36,删除具有明显的地区性和国家性的食物编码,保留普遍通用的食物编码;删除CAC食物编码中关于饲料的食物分类编码;删除CAC食物编码中4000-5000同物异名的重复编码;,编码筛选原则,2023/10/5,37,(1)当中国的食物在CAC的食物编码中能找到相应的编码时,全部采用CAC的编码,编码类型为两位字母代码加四位数字;,编码方法,2023/10/5,38,(2)当中国的食物是具体加工的食物时,在其原料食物编码后面加
18、两位数字01、02等;,编码方法,2023/10/5,39,(3)当中国的食物是具有中国特色的而CAC编码中没有的食物以同类食物两位字母代码加6000开始进行独立编码;,编码方法,2023/10/5,40,(4)对于一些食用频率较少又不常见的食物以同类食物代码加9999表示。,编码方法,2023/10/5,41,食品来源 category食品类别 type食品组别 group食品序列号 number食品加工方法 methods*每个食品赋予二个编码:国内六位编码和CAC食品编码,(01、02、03、04),(A、B、C、D),(001、002、003),(FC0001、FC0004),(00、
19、01、02),五级分类编码(参照CAC),2023/10/5,42,CDEEM 食物分类,A级 初级植物产品,B级 初级动物产品,G级 其他加工食品*,D级 植物来源加工食品,E级 动物来源加工食品,F级 多组分加工食品*,01水果,02蔬菜,03禾本,04坚果种子,05香料,001柑橘类,002仁果类,003核果类,004浆果类,005热带水果,FC0001柑桔,FC0002柠檬,FC0003蜜橘,FC0004橙子,FC0005柚子,Category,Type,Group,CAC code,食物谱系图,2023/10/5,43,CAC编码,植物类加工食品,植物来源单组分产品,谷物碾磨部分,杨
20、月欣的六位码,加工方法,2023/10/5,44,加工方法编码(21种),2023/10/5,45,食品分类,(GEMS/FOOD consumption cluster diets)食物分类,参照2002年食物成分表分类标准、国际食品法典委员会(CAC)通用分类标准和GEMS/FOOD Consumption Cluster Diets要求进行分类:,2023/10/5,46,中国食物成分表(杨月欣)食物分类,2023/10/5,47,*表示本次研究添加的类别,中国膳食暴露评估食物分类,2023/10/5,48,污染物监测数据合并归组,构建桥梁数据库,要实现从污染物监测数据中随机抽样,与膳食
21、消费量数据随机匹配,计算污染物暴露量,要求每种农产品监测的某污染物要有一定的检测样本量。若样本量过少,需要对检测的农产品的样本量进行合理的归组合并。,膳食数据与污染物数据的整合,膳食调查的是食物摄入量,而污染物监测的是初级农产品,因此需要建立桥梁数据库,将膳食调查数据和污染物监测数据连接起来。桥梁数据库包含了连接膳食调查数据和污染物监测数据的主要信息,是构建膳食暴露评估模型的重要基础。,2023/10/5,49,污染物监测样品频数,样本量n50,样本量n=50,样本量n50,样本量n50,样本量n=50,样本量n=50,做舍弃处理,筛 选,组内 合并,类内 合并,输出,校正不合理归类,谱系由下
22、而上逐级归并,核查,核查,核查,污染物合并归组流程,2023/10/5,50,污染物监测数据库,铅合并归组数据库,膳食调查数据库,完全匹配,污染物监测食物CAC细码及粗码,对膳食调查五位码赋予农产品CAC细码,按食物CAC细码与食物五位码进行匹配,不匹配,铅桥梁数据库,适当合并归组,标记后舍弃,铅桥梁数据库构建流程,2023/10/5,51,污染物监测数据中所监测的农产品采用CAC编码。,桥梁数据库CAC编码、膳食五位码、六位码、加工方法、加工因子、变异因子、标识变量等。,膳食调查数据中所调查的食物均采用膳食五位码。,2023/10/5,52,污染物监测农产品的编码是桥梁数据库构建的基础;合理
23、的污染物监测农产品合并归组是桥梁数据库的建立的关键;以铅为例构建桥梁数据库的思路和方法可以推广到其它污染物的研究;,2023/10/5,53,CDEEM 简 介,CDEEM全称:China Dietary Exposure Evaluation Model 可用于食物中化学污染物暴露评价最主要的功能及特征:数据管理:分类、筛选等;核心模块:bootstrap&Monte Carlo、暴露分布、模型验证;分析结果报告:选择性结果报告、统计图表等;用户友好式界面操作:菜单、对话框、功能键等。,2023/10/5,54,开始界面,默认语言是中文,如用鼠标点击英文,将进入英文界面的CDEEM 点击进入
24、按键可进入CDEEM,2023/10/5,55,CDEEM 主界面,2023/10/5,56,膳食调查数据的描述性分析,食品消费量数据描述性分析结果 按六位码分食品大类(g),2023/10/5,57,食物中污染物检测数据描述性分析结果(mg/kg)污染物名称:铅,污染物监测数据的描述性分析,2023/10/5,58,中国短期摄入量估计值-NESTI(ug/kg体重/天)化学物名称:毒死蜱perofARFD:急性参考剂量的百分数(%),点估计分析结果,2023/10/5,59,概率模型结果,急性概率评估模型分析结果污染物名称:铅单位:ug/kg体重/天,2023/10/5,60,急性概率评估模
25、型分析结果各年龄组暴露量分布(ug/kg体重/天),概率模型结果,PDWI=3.57,2023/10/5,61,高暴露人群(P95)摄入各食物贡献度(ug/kg体重/天),贡献度分析,2023/10/5,62,贡献度分析,高暴露人群(P95)摄入各食物贡献度分析结果污染物名称:铅;单位:ug/kg体重/天,2023/10/5,63,模型评价,模拟消费量数据概况,2023/10/5,64,模型评价,概率模型与点估计模型估计结果比较(小麦粉,ug/kg/day),2023/10/5,65,模型评价,双份饭法摄入量分布与概率估计分别各百分位数的比较 暴露量(ug/kg/day),百分位数,双份饭,P5,P25,P50,P75,P95,Back,2023/10/5,66,谢谢!,