GB_Z 43768-2024_信息与文献 网络存档的统计和质量问题.docx

上传人:李司机 文档编号:7217073 上传时间:2024-06-29 格式:DOCX 页数:12 大小:78.33KB
返回 下载 相关 举报
GB_Z 43768-2024_信息与文献 网络存档的统计和质量问题.docx_第1页
第1页 / 共12页
GB_Z 43768-2024_信息与文献 网络存档的统计和质量问题.docx_第2页
第2页 / 共12页
GB_Z 43768-2024_信息与文献 网络存档的统计和质量问题.docx_第3页
第3页 / 共12页
GB_Z 43768-2024_信息与文献 网络存档的统计和质量问题.docx_第4页
第4页 / 共12页
GB_Z 43768-2024_信息与文献 网络存档的统计和质量问题.docx_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《GB_Z 43768-2024_信息与文献 网络存档的统计和质量问题.docx》由会员分享,可在线阅读,更多相关《GB_Z 43768-2024_信息与文献 网络存档的统计和质量问题.docx(12页珍藏版)》请在三一办公上搜索。

1、前吉III引力IV1范阳I2 ElMlestIIliW求系统二如浏览曙或爬虫(3.12)发送到远程服务器的InTp格式消息.以骁取由URl.标识的特定资源.137晌应rvspomr远程服务器对费源的HrrP请求(3.36)的陶答.包含请求的资源、到另一个UR1.的电定向.或指示无法返回请求银液原因的拒绝留说)响应.3.38晌应码ITSPOnsecode状态码statuscode向请求服务器说明请求资源状态的三位数字.注;例如,以mW开头的他,场滞求的资源不可用。mflH名称每次访向所砌宽的页i敷目标评估用户而存档的兴捶加提条件一一报告期内闹觉的页面慈敬:一同一IW间的网络居访问总数方法何次访何

2、所掰览的页面敷为:ABIIXlK中,A是在一个报告期内廨克的页面总数:B为网期访问的总次数,四舍五入到小微之后一值说明高比率我示网络存Fi的大量使用居这意味价存档保存了,用户相关的内布.更好地等虐用户和研究人员的需求和期皴(如通过谢合)是提我这个比率的一种方法631.5指标Sg12名称至少什一个乳本的货淞的仃分比目标评估比特浓的保存能力前悔条件一一网络存档中的资源总数,鱼少在一个剧本的资源数.il克可通过i:R1.或字节为值位来完成方法至少有一个副本的资源的百分比为:AZBXKKft其中IA是至少守一个副本的宽源Bt;B是网络存档中的货源总数.四合五.人到小数点后一位说明应蛤出用于计嫌的评佑肽

3、位,即1:R1.或字节指标接弓15名称已制定保力抽玷的格K的资源的仃分比目标寿佑机构对网络存档的蓬轼保存的保障程度前提条件一一网络存档中的资源就数:已制定保存策略的格式的资源故业.该计算可通过IR1.或字节为单位来完成方法已制定保存策路的格式的资源百分比为:ABIOM其中IA是已制定保存策略的格式的货源的数最:B是网络存档中的资源敝.四舍五人到小数点后一位说明应给出用干计3的评估条位,即IR1.成字节16名称经过病行检我的砺世的百分比目标评估网络存档对于其他资源集合和用户设备的安全使用情况Ilm条件一对络存档中的资源总数:经过柄近检货的宽海款量.设计加Jia过IR1.或字件为的他来完成方法经过

4、耦麻检杳的资源的Ci分比为IVBXKKft其中:R是已经过例行检件的资源的数MlB是网络存档中的身淞忌致,四例五人到小数点后位说明关于制毒检测,机构可能会决定不从网络存档中删除衲卷,而是见止对受绯染资海的滴同,应给出用于计犯的评怙毋他,即IU1.或字节7用WCUt7.1侬统计数据和旗量指标有助于做盘和评估网络存档的性使,并成为个机构的定期规划和评估工作洲的一部分.泰统地生成统计数据和评估网络存档的场51:有很多好处:有助于做出明智的决策I-一通过提供必要的控制点来帮助管理网络存档操作I一一促进网络存档机构、忡助者和资助机构以及用户社区之间的对话;一一提高对网络存档的认识.鼓励最佳实践:一一有助

5、:找出定距和共同的同尊,以便通过果柒机构之间的合作来共同解决这些问题:提供了(进度)完成的证抠.并有助于证明网络存档的价(ft.7.2本文件中定义和描述的统计术语和质量指标可用于评估网络存档的性能,还可用于衡量和比较网络存档.统计数据是中性和客观的数据,为进步的分析和解并提供了我珈,质局指标表示一个价值判断;应用指标的钻果能够显示性能的优劣,本文件还包括总体假述及各种技术流程的详细描述.尽管文件全文与所有读者相关,但表10突用显示了3个主要目标用户群体所关注的核心内容,隹议详细(SJ读木文件的特定部分,10JiJil用和读看用户群体耒典访“和保存决策者511.4.4.1.55,2,1.5.2.

6、6.5.J,1.5.a,4.5.6.6.1第1拿,4.4.4.5.5.4.1.5.4.5.a5.1.5.5.5.5.6.6.1保将管理bi4.1.4.4.5.2.S.3.第6盘4.2.4.3.4.4.5.4.5.5.&5.5.4.第6章工程何4.132.5.31.2.4.3.5.4.5.57.3 对用户阱的好处本文件对采集机构内部和外部的决策者(管理人员)、遴选和管理网站的保存管理员以及管理系统、维护基础设施和支持技术操作的技术人员(工程,巾)都双有用.U)时于决策看(员)与班源泉台和访问有关的统计数据和版代指标有助于充分规划资源,也有助于根据与机构使命的一致性来评估网络存档的成功程度.与成本

7、相关的指标有助于评估和购定计划开发的优先级.质量指标还允i午使用通用术语来俄示论证网络存档的成果.W对于保存曰员关于货源It合的统计数据有助于保存管理员聚饭在遴选的关键领域,井允许将遴选过程与其他机构进行比较.与访问相关的质量指标可括助确定未来的衡求.与保存相关的短Ift指标有助于制定元数据采集策略.历fit指标也支持对保存管理员的绩效评价.c)MTI三W统计数抠和侦员指标允许1.程师了解网挤存档系统的各种技术层面及其性能.这些数据需要定期揪告以帮助优化服务和运营.与保存相关的统计数据和质量指标至关市变,可帮助设计系统以确保网络存档的持续可访问性,7.4 按用户解体使用IS出的4HHK本文件中

8、提出的所有统计数据和指标都与目标读者相关.然而,图1突出显示了主要用户群体之间的交流和讨论的核心集。三角形侧边的统计数据与与卷名字的两个用户群体而度相关,三角形中间的统计数据与所有用户群体都高度相关,例如,三角形上方的统计数据与保存管理员和工程师之间的交流高度相关.孤取实例数ms已MM格式教MIMEV已切定保存茉M的格火敢1检用户停使用计较,图1使用的术语在我U中解棒.11B1中使用的术诏类型统计散必字节存档的规模,可按压缩用或未压缩计解抓取实例数目标加取实例的数限状确J按状态码划分的UR1.的分布.特别是2XX系列压缩后坟摸存档R缗后的规模,幽位为字节成本硬件、HW.扰件、劳动力成本日期时同

9、袍Ba曲主机数域或:E机的数置域规恢传个城或好个主机的贯源体嫉分布己刖定保存镣略的格式软1.IW定保存信略的文件格式的致足已M别格式致己识别文件格式的数MliIE类S格式类型的数或备选资源数备选资淑的数最页面浏览数己浏览的页面放许可数许可的数M复制存储ft已红剂济源的体质搜索词在存档中ft用的H而行的搜索词目标数目标的数他T1.Dtttt顶侬或:奴域的iM未压缩规模存音的未压缩规模,值位为字书UR1.tt11.(SWl应)的总数访何时长一次访何的平均时长访客数独立访客的数依访问数访问次数VZARCft*ARC文件或耳他字磔文件的畋城7.5 网嬉存SKfi1.及相关性能M本文件提出的统计数据和质

10、显指标被唳射到图2的通用网格存档I:作流程中,以指明网笫存档猊程中对应哪些指标.也网”14衿子)东果Iti道达国界段博源集介,许可敷I.3也黄蹲数IWHE8使用也山内向子子发&求)/Zz*Ax;/i络俅J1书子卜-生成成落文件)(而*拄制J吩Wk伤澧。介过日利龙征:11h.tt: R你实例敷 CHia 状态科, I机嫉款; -,血); 每个城的怖SU MlME奥奴分布I IW布豆时间周期内Nh的消失勤剧隗:许可位阳内掘Iaia长8(nxIK口隹%旬3)俅“密海集合忖.但,MI1元数微已做城的丈件格式已附止保存电略的格NM解的伤源*12:6H.a文,不W何的宣魂(:己识对文什格式的应淑(、):宝

11、口史使前()使用AMftWMHttWttmi页面以怅th访何(仑还)数:独立S露鼓:仿,JMK,篌次访何的!11IWMKlfti跖点上的投集词可神终本用户也田匕(*:全又去引资%(%QttRffiieD:1.?忱用R财存微BW的用户()图2网络存档流程及对应的性诧指标考文*1 GB/T33994-2017信息和文献WARC文件格式(ISO28500:2009,IDD2 ISO2789InformationanddocumentationIntemalionallibrarystatistics3 ISO9000:2015QualitymanagementsysensFundamentalsan

12、dvocabulary1ISO11620Informationanddocumentation1.ibraryperformanceindicators5 ISO14721:2012SpacedataanlinformationtransfersystemsOpenarchivalinformationsystem(OIS)Referencemodel6 ISO15189-1:2001InformationanddocumentationRecordsmanagementPart1lGeneral7 ISO16-139:2014InformationanddnMethodsandPr(XxdU

13、reSforassessingtheimpactoflibraries8 DigitalR.A.M.B,O,R,A.(DRAMBORA),availablefronrhttpjwvw.repsi(or),audit.eu9 GlobalW.MS.avaiIabIefrom:http:/www.ifabc.org/10 TransferProtocolH.HTIP1.1,availablefromrht(prww.ictf.org,zrfcrfc26l6.txt11 EncodingM.StandardT.(METSavailablefrom:http:/www.loc.gov/siandard

14、xmclMETSOvervicw.hlml12 MultipurposeInternetMailExtcnsion(MIME)PartTwozMcdiaTypeS.availablefrom:http:AvwwJctf.org/rfc/rfc2046.txt13 NcstorCatalogueofCriteriaforTrustedDigitalRcpositorics.availablcfrom:http:7files.d-nb.denestorna(efialienes(or.mat-08-eng.df14 RevisedGuidelinesForStatisticalMeasuresOf

15、UsageOfWeb-BasedInformationResources.availablefrom:hup:/ WebAnalyticsASSoCialion.availablefrom:http:/www.webanalyticsassocialion.orgf?pagc=standards18Wcbsitcmetricdcfinitions,availablcfromrhttpr/www.jicwcbs.org/standards.php19 BA1.1.A.2010.WcbArChiving.availablefronrh(pwww.dcc.ac.uksi(edefaukfiles/d

16、ocuments/fvporis/sarwa-vl.1.pdf20 BERMES.E.andI1.1.IEN.G.2(XW.MclriusandStrategiesforWebHeritageManagementandPreservatioiKavailablefronrhttpzcoi)ference.ia.orgpasb,ia7592-be11nes-en.pdf21 BRCGGER.N.2OO5.ArchivingWcbsitcs.GcncralConskicrationsandStrategics,availablefrom:httpcfi.au.dk11leadninwww.cfi.

17、au.dkpublikationerzarchivingunderside.archiving.pdf22 DoUGHERTYMMEYERET.MADSENC.VANDENHEUVE1.C.THOM-S.andWYTT2010.ResearcherEngagementWilhWebArchives:StateoftheAn.Report.I.ondon:JISC,avaiIablcfrom:http:/23 DRO1D(DigitalRecordObjectIdentificauonhavailablefrom:htip:/p11)jecls,d11)il24 11KAccessWorking

18、GrOUP2OO6:USCeasesforAccesstoInternetArChiVcS,availablefronhi(pwww.nepreserve.org,resourcesusecases-access-inteme(-archives25 JACOBSEN.G.2007VebarchivingInlernaHOnany:Intcn)pcrabililyintheFuture?ResultsofasurveyofWebarchivingactivitiesonnationallibraries.PaerpublishedontheIF1.N-ETPriOrtotheWorld1.ib

19、raryandInformationCongress:73rdIF1.AGenera!ConferenceandCouncilheldinDurban.Southfrica.availablefro11Eht(pnetarkivet.dkub!ika(ioner11nteroperability-InTheFUlUre_lF1.A2OO7.pdf26 JHOVE-JSTORZHarvardObjectValidationEnvironment,availablefn)m:http:/jhove.Sourceibrge.ne(27 MASANESJ.(ed.),26.WcbArchivinglS

20、pringenBerIin.28 MASANES.J.2002.TowardsContinuousWebArchivingJnrD-1.ibMagazine8(12).availablefrom:hi(p:/www.dlib.org/dlib/deceinberO2/masanes/l2niasanes.htinl29 MEYERE,THOMASAandSCHROEDER,R.2011:WcbArchivcsiThcFuture(三).availablefrofn:hitp:/papers.ssrn.coin/sol3/papers.cfm?abstract_id=183002530 PINS

21、ENT.E.DAVlS.R.SH1.EY.K.KE1.1.Y.B.GUY.M.andHATCHERJ.2010.PuWR:ThCPreservationofWebResourcesHank.availablefrom:httpwww.jisc.ac.uk.,publicationsrogrammerelated2008.,powrhandbk.aspx31 AUBRY.S.20IOjIntroducingWebArchivesasaNew1.ibraryServiceithcExperienceoftheNational1.ibrar),ofFrance.Iir1.iberQua(eriy20

22、10l.20.no.2.availablefromhupliber.lib11ry.uu.nlindex.phlqarticleview798732 BI1.EY.S.andTHoMPSON.D.2006:UKWAcBUildingtheUKsFiistPublicWebArchivc.D-1.ib.2(X)6.12(1).Availablcachttpjwww.dlib.orgdlib,january06tho11pscnOlthompson.html33 Gl.ENN.V.2007:PrcscrvingGovernmentandPoliticalInformatknfhcWcb-at-Ri

23、skProjcct.FirstMonday.2007,l2(7).Availableachttpfirstmonday.org?htbincgiwrap,binojsindex.ph,fnarticleview1917/179934 HOCKX-YU.H.20lkThcPastIssueoftheWcbjnzProcccdingsoftheACMWcbSciMI,WebscienceTrustJune17.2011.availablefronrhi(pwww.webscill.orgfileadmiawebsciPapcrs/PastlssucWcb.pdf35 HOCKX-YU.H.CRAW

24、FORD.1.ROGER.C.JOHNSON.S.2010:Capth6cairesetd,insti(u(ions(IF1.A).Quebec.Canada,availablefrom:hi(parchive.iila.orgVifla74papers,IO7-lllien-f,pdf37jI1.1.IEN.G.ankingbackatfiveyearsofputtingnewlegislationinlopracticeandenvisioningthefuture.InrPriKreedingsfthe77(hIH.AcongressmanJuan,PortoRicotavailablc

25、from:httpzconfcrcncc.ifla.orgpastifla77l93-stirling-cn.pdf38 JCOBSEN.G.2008:WebAivhivingJssuesandPrOblemSinCOHeCuonBuildingandc-CejiSJn:IJberQuarterIytVoluine18.Nr.3/4(2008).availablefirom:http:/iiber.library.uu.nl/index.php.1q/article/view/7936i82021.391.ASFARGUESFQURYCandWEND1.ANDH.2OO8:1.Cgaldepo

26、sitOftheFrCIKhWcbzharvcstingstrategicsforanational(IomainjniProcccdingsofthe8thInternationalWebArchivingWorkshop,Aarhus,l)ancmark,availablefromhttpiwaw.nc,08WAW2(W8-l.asfargucs.pdf40 OURYC.PEYRARDS.201l:FromtheWorldWideWebtodigitallibrarystacksipreservingtheFrenchWcbarchives.ln:ProceedingsofiPREiS20

27、11.p.231-241.availablefrom:hltp:/halshs.aruhives-ouvertes.fr/halshs-0()86872941 POPEjandBERESFORPh.2(M)7JIPCWcbArchivingToolsctPerformanceTestingaltheBritish1.ibrarj.ln:Ariadnc.no.52(2(X)7)tavailablefromht(pwww.arialne.ac.uk/issue52ope-beresford42 RAUBER.AASCHENBRENNERA.WITVOET.O.BRUCKNER.R.andKAISE

28、R.M.2002:UncoveringInformationHiddeninWebArchives:AGlimpsea(WebAnalysisBuildingonDataWarehouses.D-1.ib.22,8(12).Availableatjhttp7www.dlib.orgdlih,december02.zraubcrl2raubcr.html43 SMITHJ.andNE1.SON1.28zCreatingPresavadorvReadyWebRcsouxres.D-1.ib.20()8.14(1.AvailableaChttprwvw.d)ib.orgdlib.,januarylDlsmith.html44 SPENCER.A.SHERIDANJ.THOMAS.D.aniiPU1.1.lNGER,D.2009:UKGov.cmmcntWcbContinuityzPcrsistingAccessthroughAligningInfrastructurcsJntcmationaIJournalofDigitalCuration.2009k4(1).Availableat:http:/

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号