当前位置:文档之家› 药品数据分析

药品数据分析

基于GMP的药品数据分析苏勤2010.11道可道,非常道。

------老子新版GMP实施箭在弦上,药企有备才能无患。

实施GMP的目的:要把人为差错降低在最低程度,防止一切药品污染,建立高质量的保证体系。

GMP各项管理标准的实施是以数据支持为基础。

自然界,从最小的贝壳到最大的漩涡星系,无不和宇宙中大部分美丽的东西都呈现出数学特性。

古代最伟大的哲学家之一亚里斯多德曾说过:‘数学格外地展现了秩序、对称和极限,而这些也是美的极致形式。

’数字美丽的天性,也赋予了我们在制药生产中的管理艺术。

善待数据珍惜管理的无形资源掌握现状,工序调节,工序管理,检查和评价,分析和改进。

2005年12月FDA CGMP对中国培训中提到,不可接受或错误的数据和记录.不诚实数据的特征:不真实,编造,虚假,无系统。

被认为是审查程序的材料之一的递呈书中重要数据缺失。

应该让上报的数据却未被上报。

不准确(例:第一次数据未达标,重测的数据达标准,但未经实验室调查,将此数据上报用于申请中。

)算:特征数找:相关因素看:动态变化比:统计值数据的处理---数值的修约四舍六入五考虑,五后非零前进一,五后为零看奇偶,五前奇数则进一,五前偶数应舍去,不论舍去多少位,必须一次修约完。

数据的处理---筛选方法法一.按美国E·J鲍尔推荐的方法进行处理。

步骤如下:1.计算这群检测值的平均值2.计算极差R3.计算可疑值X i与平均值之差的绝对值,再用极差R除,得出t i,与规定附表的临界值比较,若t i比表上的t值大,则应弃去此可疑值。

注:用公式t=|X-|/R 计算t ,如计算值超过表上的值时,则所调查的值是无效的。

此概率约为0.95。

《例1》某分析者对一样品检测,得(1)93.3%,(2)93.3%,(3)93.4%,(4)93.4%,(5)93.3%,(6)94.0%。

问:第六个结果有效吗?n3456789t 1.53 1.050.860.760.690.640.60X n 10111213141520t 0.580.560.540.520.510.500.46附表如下:抛弃无效测量的临界值解:1.计算方法六个结果的平均值=93.452.计算极差R =94.0-93.3=0.73.计算可疑值与平均值之差的绝对值再用极差除:t i =|X -|/R =(94.0-93.45)/0.7=0.794.与临界值t=0.76(n =6)比较∵ t i =0.79>t=0.76∴94.0%是一个离群数据,应弃去.X X法二:G-检验法(格鲁布斯法)检验步骤:1.算出包括可疑值在内的平均值;2.计算可疑值与平均值之差;3.算出包括可疑值在内的标准偏差;4.用标准偏差除可疑值与平均值之差,得G 值;5.查G 的临界值表,若计算的G 值大于查到的值,就可把可疑值舍弃.SX X G -=数据的处理---数据特征值位置特征量: 子样平均值子样中位数差异特征量: 极差R=X max -X min标准差变异系数(相对标准差RSD )x ~∑==n1i iX n 1X 2n 1i i)X (X n 1S ∑=-=%100C V⨯=xs均值的置信区间估计(有限次实验结果处理)在实常工作中,常常对某些参数进行估算.但是,由于某种因素的影响,而难以给出精确的估计,这样就使估计值带一定的偏差,这些都用区间来估计真实数.通常在一定的精度要求下,对一个总体的某个参数估计出一个取值范围,又称置信区间,区间的上限和下限叫置信界限.质量管理的控制限在质量控制中出现的报警限和行动报警限,如:对工艺用水与洁净区的环境在控制中根据正常工序情况,制定出可行的指标,即报警限+2S ,超出此界限意味着发出了报警。

行动限:+3S 超出此界限时,质量管理上要立即采取行动。

X X方法1---过程能力指数(C p值)过程能力(B)含义:在一定时间内工序处于稳定状态下的实际加工能力。

测定:B= 6S1.是工序的一种可以量度的特性;2. 反映与公差无关;3.在正态分布情况下,6 范围内的概率为99.73%。

过程能力指数C P用来表示过程能力满足规范的程度,以便分析、判断过程能力状态.2过程能力:指过程能够生产出合格品的能力。

是以过程能力指数C P值的大小来评价或判断的。

企业为保证产品质量稳定,对其生产工序进行考察,以过程能力指数来评价。

1X过程能力判断准则工序能力状态工序能力指数严重不足CP (CPK、CPU、CPL)<0.67不足0.67≤CP (CPK、CPU、CPL)<1正常1≤CP (CPK、CPU、CPL)<1.33理想 1.33≤CP (CPK、CPU、CPL) ≤1.67过剩CP (CPK、CPU、CPL)>1.67过程能力指数对应的不合格品率C P 不合格品率CP不合格品率1.676/1000万 1.11/1000 1.57/100万13/1000 1.336/10万0.67 4.55/100 1.23/1万0.3331.75/100方法2 ---正交试验设计正交设计是用于安排多因素试验的一种科学方法.在多因素的情况下,选择最佳条件的比较方便方法.它适用于多因素的工艺参数的优化,我们将其应用于研究工作、生产试验的设计,极大地提高了试验的可靠性和效益。

常用正交表L4(23),L8(27),L16(215),L9(34),L8(41×24)原理:利用数理统计的观点,运用正交性原理,从大量的试验点中,挑选适量的具有代表性典型性的试验点,用正交表来合理安排试验的一种方法.用途:正交试验就是利用正交表的特点进行研究试验,找出最佳工艺条件为生产奠定基础.正交试验设计步骤:1.明确试验目的,确定考核指标,2.根据试验目的,挑选出试验的因素,3. 选定每个因素变化的水平4. 选择最合适的L表5. 根据因素和水平设计出试验方案表6. 进行试验并记录好数据7. 设计计算表并计算、分析8. 找到最佳搭配常用正交表:方法3 ---假设检验基本思想根据是小概率原理,所谓小概率原理:即“在一次试验中,概率很小的可件认为是实际上不可能发生的事件,而概率接近于1的事件认为是实际上必然发生的事件。

”我们可以根据所获样本,运用统计分析方法,对总体X的某种假设H0作出接受或拒绝的判断。

基本步骤1.建立假设H0:μ=□□2.选择检验统计量,给出拒绝的形式3.给出显著性水平α4.由样本值计算出统计量的值5.根据统计量的不同分布查相应的分布表6.作出判断当φ>λ则拒绝Hφ<λ则接受H0基本类型1.检验母体平均数2. 检验二个母体平均数相等3. 检验母体方差4.检验二个母体方差相等假设检验(显著性检定)目的1.检定产品质量与标准比较,有否差异2.检定产品质量间的差异3.评估质量控制中各因素间的差异4.评估生产过程中各工序间的差异差异的表示: 均值标准差最常用的假设检验应用(一)☆确定总体的均值与质量标准值的差异性1. 〔U 检验〕σ已知,使用u 统计量2.〔t 检验〕σ未知,σ用s 估计,使用t 统计量断判各查u, t 检验临界值u α, t α1.当u <u α时, 则H O 成立2.当t <t α时, 则H O 成立nx u /0σμ-=nS x t /0μ-=最常用的假设检验应用(二)☆确定两个样本间的均值差异性〔t 检验〕方差未知,但相等H 0; μ1= μ2计算查t 检验临界值H α,当t <t α时, 则H O 成立。

2n n S )1n (S )1n (S 21222`2110-+-+-=2102111n n S x x T +-=最常用的假设检验(三)☆确定2个样本间的标准差的差异性〔F 检验〕未知::计算按F( n 1 -1 , n 2 -1 , ) 查F 检验临界值H α,当F <F α时, 则H O 成立。

1μ2μ0H 2221σσ=),min(),max(22212221s s S S F =2 α最常用的假设检验(四)☆确定多个样本间的标准差的差异性〔哈特利检验〕假设H O : m ≥3的正态总体,独立取容量为K 1=K 2=K i K i ≥3 , 计算自由度df=K-1查哈特利检验临界值H α,当H <H α时, 则H O 成立。

2min2maxS S H =2232221...m σσσσ===假设检验在制药生产企业管理中的应用1.产品质量与标准值的比较2.实验室间数据的比对3.新老工艺比较4.分析工作的重复比较5.检验工专业水平比较6.设备或仪器使用性能比较7.检验用标准品挨批号的对照8.验证中的数据处理9.各种控制的区间予报方法4---线性回归分析研究变量间的定量关系式时称为回归分析.直线回归:通过试验可以测定一个变数对另一个变数的影响,在数学上可写成Y=f(X),如果二者的关系是直线关系,则此式就呈Y=a+bX,这时叫直线回归.回归分析的主要内容:☆从一组数据出发确定这些变量之间的定量关系式☆对这些定量关系式进行统计检验☆从影响着某一个量的许多变量中,判断哪些量的影响是显著的,哪些是不显著的☆利用所求得的关系式对生产过程进行予报和控制.判断两个变量有无相关关系的方法:☆简易法☆相关系数法回归分析在制药企业中的应用1. 找出影响产品质量的主要因素2. 药品质量的趋势分析3. 对某个质量特性进行分析4.寻找工艺控制条件5.确立标准比色液的工作曲线6.确定药品的有效期回归分析法找出影响产品质量的主因每种产品都有几个质量特性值,它们间是互相影响并互相制约的、找出影响产品质量的主因,就可以抓住主要矛盾,在生产过程中加以控制,使产品质量保持稳定。

运用电子计算机为工具,以多元线性回归法、求出因变量Y与自变量X i(i=1、2……n)的方程Y=b0+b1x1+ b2x2+…+b n x n,用方差分析检验回归方程,当F>Fα时,方程效果显著,求出F1、F2…F n比较,按F值大小,即可找出影响Y的因素顺序。

帕累托分析:关键的少数;次要的多数方法5---排列图通常占总频数80%以上的项目是主要问题,占总频数10%以上的项目是次要问题,余下的占总频数10%左右的项目是更次要的一般问题。

排列图的作图步骤1. 收集数据.2. 选题.3. 设计数据记录表.4. 填表并计算,按数量从大到小顺序填入表中,其他项的数据由许多数据很小的项目合并在一起,将其列在最后.5. 画两根纵轴和一根横轴,左纵轴标上频数的刻度,最大刻度主总频数;右纵轴,标上频率的刻度,最大5.画两根纵轴和一根横轴,左纵轴标上频数的刻度,最大刻度主总频数;右纵轴,标上频率的刻度,最大刻度为100%.左右刻度高度相等.6. 在横轴上按频数大小画上矩形,其高代表各项目频数的大小.7. 在每个直方柱右侧上方,标上累计值,描点,用实线连接,成巴雷特曲线.8. 在图上记全有关事项.排列图在制药生产企业中的应用1.寻找产品存在的质量问题2.寻找影响产品质量问题的主因3.进行用户信息分析4.进行产品市场分析5.进行产品成本分析6.不合格品分析7.生产现场存在问题分析8.各类事故方法6---控制图控制图是对过程质量特性值的数据进行测定、记录、评估,从而监察过程是否处于控制状态的一种用统计方法设计的图.作用:☆对生产过程进行监控发现异常,及时告警☆控制图的种类:分析用控制图控制用控制图其结构:中心线CL =上控制线UCL =+3δ下控制线LCL =-3δX X X控制图的原理质量由人机料法环五个方面,它又可分成偶然因素与异常因素两类。

相关主题