此文简单介绍了一些经常被提到的文本文档格式,以下内容大多数参考了维基词条。至于遇到陌生格式如何打开这些文档?有多格式也是我没遇到过的,或者本身为了保密而不普及其阅读和编辑器,所以不能一一提出方法,见谅。
安卓平台的掌阅iReader电子书阅读器支持EBK3/TXT/UMD/EPUB/CHM/PDF全主流阅读格式,能满足正常需要。
如果遇到生僻格式,可以试试calibre打开并转格式,calibre是一个自由开源的电子书软件套装,可以用来组织、存放、以及管理电子书,支持大多数的电子书格式。有windows和Linux版。同时也支持与许多流行的电子书阅读器进行同步,并可能在DRM的限制下转换电子书的格式。
AZW3(.awz3)azw3的本质是KF8,是随着年Amazon推出KindleFire平板时一起推出的。它填补了Mobi对于复杂排版支持的缺陷,支持很多HTML5(目前尚不支持HTML5的视频和音频标签)和CSS3的语法,这就大大改善了原来mobi或azw内容排版上的一些缺陷,单纯从读者的角度来讲,是不输epub格式的。目前从Amazon购买的书,大部分已经是azw3格式了,而以前主流的mobi格式则越来越少,它正逐渐取代mobi成为Kindle电子书的主流格式。
CAJ(Chineseacademicjournal简称CAJ)是清华同方公司的文件格式,中国期刊网提供这种文件格式的期刊全文下载,可以使用CAJViewer在本机阅读和打印通过“全文数据库”获得的CAJ文件。知网上下载的论文大多是这个格式的。 阅读软件:CAJViewer7.0
CEBCEB即ChineseeBook,是完全高保真的中文电子书的格式。由北京方正阿帕比技术有限公司开发的全新的电子图书阅读工具——方正ApabiReader使用的格式.它能够保留原文件的字符、字体、版式和色彩的所有信息,包括图片、数字公式、化学公式、表格、棋牌以及乐谱等,同时,该格式对文字图象等进行很好的压缩,文件的数据量小。
CEB的优势和技术先进性:在不同的软硬件环境下保持显示不发生变化,生成后不可修改;融合了当前主要字型表示技术:包括各种编码体系和各种字库技术,支持少数民族文(蒙文、维文、藏文、韩文等)的转换;自动下载补字,保证CEB文件不发生“开天窗”的情况;提供全面图形处理技术(包括各种线形的完整描述);提供全面的图像和颜色处理支持及压缩(如多种色彩空间、包括ICC在内的色彩还原、RLE,G3,G4,Wavelet等数据压缩);支持电子签名,数据加密等安全机制;转换方便,几乎所有格式都可以转换成CEB格式,包括XML、S、PS、PDF、TIFF、DOC、WPS等;CEB文件占用空间小,在排版比较复杂情况下,只有原来DOC文件的十分之一;CEB与XML结合,支持版面自动生成,支持信息提取,使用灵活;可以在CEB上制作目录、链接跳转,增加声音、动画和视频。
方正CEB版式文件作为电子文档一体化的基础、国家电子公文的版式文件推荐的参考标准,可以原版原式、原滋原味的展现电子公文,电子文档的不可篡改性,保证文档的完整性。
CHM(.chm)CHM是英文“CompiledHelpManual”的简写,即“已编译的帮助文件”。CHM文件格式是微软年推出的基于HTML文件特性的帮助文件系统,由于与网页浏览器有着高度的相似及众多优点,使得CHM格式的电子书及读物广受用户的喜爱。被IE浏览器支持的Javascript、VBscript、ActiveX、JavaApplet、Flash、常见图形文件(GIF、JPEG、PNG)、音频视频文件(MID、WAV、AVI)等等,CHM同样支持,并可以通过URL与Internet联系在一起。chm文件因为使用方便,形式多样也被采用作为电子书的格式。
Djvu(.djvu)DjVu是一种计算机文件格式,主要用于存储扫描的文档。这种格式的特色包括图像分层、渐进载入、算术编码、对二进制图像进行有损压缩,从而以较小的空间,存放高质量的可读图像。
渐进载入使得DjVu适合于应用于因特网。DjVu对于大部分的扫描文档,表现都优于PDF,故常被作为PDF的替代品来进行推广。这种格式已经在文件共享网络中,被广泛使用于分发数学书籍。跟PDF类似,DjVu也可以包含光学文字识别的文本层,这样就可以使用复制与粘贴操作。
DjVu技术最初由ATT实验室的扬·勒丘恩(YannLeCun)、LéonBottou、PatrickHaffner和PaulG.Howard于年开发。DjVu是一种开放的文件格式,文件格式规范与参考库的源代码都公开发布。商业开发的所有权几年来被转给了不同的公司,包括ATT和LizardTech。原来作者维护一个GPL实现/实现,称为DjVuLibre[1]。
00年,DjVu、TIFF和PDF被InternetArchive的百万书籍计划(MillionBookProject)选中,作为公有领域书籍扫描后上线的文件格式[]。
DOC(.doc).doc,是电脑文件常见扩展名的一种,这三个字母是英文单词document“文件”的缩写。
该格式原是纯文字文件使用的,多见于不同的操作系统中,软硬件的使用说明。年代,WordPerfect以此作为其专属文件的扩展名。至年代,微软在文字处理软件Word中,使用了.doc作为扩展名,并广为流行;而前两者的格式已几近绝迹。
微软的“.doc”格式是一种自己的专属格式,其文件可容纳更多文字格式、脚本语言及撤消等信息,比其他的文档文件格式如RTF、HTML等要多,但因为该格式是属于专属格式,因此其兼容性也较低。
在PalmOS系统中,“.doc”是PalmDoc所使用的扩展名,一个完全无关的格式,主要用于电子图书的编码。
EBK3.ebk3是由掌中浩阅科技有限公司在推出ebk系列电子书格式,这种文件主要流行与掌阅书城。
EPUB(.epub)EPUB(ElectronicPublication的缩写,电子出版)是一种电子图书标准,由国际数字出版论坛(IDPF)提出;其中包括3种文件格式标准(文件的附档名为.epub),这个格式已取代了先前的OpeneBook开放电子书标准。
FictionBook是建基于XML的电子书格式,起源并流行于俄罗斯。此类文件格式为.fb。
它包含设置碑文体、经文体及引用的标签;而电子书的元数据,包括作者、书名及出版社等数据,亦可在文件中找到。因此,此格式适合用于各种自动处理、设置索引及电子书管理等。同时,将此文件格式转为其他电子书格式亦较方便。
FBReader、AlReader、HaaliReader、STDUViewer、CoolReader、Okular及iOS的Documents等阅读器均支持FictionBook。
JAR(.jar)JAR文件格式以流行的ZIP文件格式为基础。与ZIP文件不同的是,JAR文件不仅用于压缩和发布,而且还用于部署和封装库、组件和插件程序,并可被像编译器和JVM这样的工具直接使用。在JAR中包含特殊的文件,如manifests和部署描述符,用来指示工具如何处理特定的JAR。
HTML超文本标记语言(英语:HyperTextMarkupLanguage,简称:HTML)是一种用于创建网页的标准标记语言。HTML是一种基础技术,常与CSS、JavaScript一起被众多网站用于设计令人赏心悦目的网页、网页应用程序以及移动应用程序的用户界面[1]。网页浏览器可以读取HTML文件,并将其渲染成可视化网页。HTML描述了一个网站的结构语义随着线索的呈现,使之成为一种标记语言而非编程语言。
HTML元素是构建网站的基石。HTML允许嵌入图像与对象,并且可以用于创建交互式表单,它被用来结构化信息——例如标题、段落和列表等等,也可用来在一定程度上描述文档的外观和语义。HTML的语言形式为尖括号包围的HTML元素(如html),浏览器使用HTML标签和脚本来诠释网页内容,但不会将它们显示在页面上。
HTML可以嵌入如JavaScript的脚本语言,它们会影响HTML网页的行为。网页浏览器也可以引用层叠样式表(CSS)来定义文本和其它元素的外观与布局。维护HTML和CSS标准的组织万维网联盟(W3C)鼓励人们使用CSS替代一些用于表现的HTML元素。
HTML文档需要以文档类型声明(英语非正式说法“doctype”)开头。在浏览器中,文档类型声明有助于确定渲染模式——特别是是否使用怪异模式。
NLCNLC格式中国国家图书馆的电子图书格式。它把扫描的图书图像以JBIG标准压缩(无损压缩)为很小的NLC文件。NLC文件是JBIG格式的一种变种。
WDL是华康公司开发的一种电子读物文件格式。其特点是较好地保留了原来的版面设计,可以通过在线阅读也可以将电子读物下载到本地阅读,但是需要使用该公司专门的阅读器DynaDocFreeReader来阅读,该阅读器可以从该公司的网站免费下载。
种格式的电子读物由于对打印和拷贝作了限制,所以适当保护了作者和出版商的利益。与PDF格式一样,该格式依然不支持上述的一些效果。但是支持图片的导入。该格式对文件图像文字质量和最后成品的大小之间的平衡做了较好的处理,采用该格式的文件一般压缩率都比较高。对大中小电子读物都是一个不错的选择。
制作该种格式的电子读物需要使用该公司的软件DynaDoc生成器来完成。
Mobi(.mobi)mobi和azw格式的推手主要是Amazon,这两种电子书格式的发展很大程度上依靠Amazon这个巨大的内容提供商及其电子书阅读器Kindle的流行普及。它们同属亚马逊的私有格式,没有本质的区别,可以简单的这样理解,mobi是比较老的一种格式,而azw只是mobi的另一种形式而已,也可以理解为mobi加了个壳,亚马逊利用它对电子书做DRM版权保护。
目前市面上的mobi文件大部分是来自两种途径:epub、pdf或者txt转换成的mobi,从Amazon商店流出来的mobi。前者没什么好说的,后者要么是Amazon官方制作,要么就是自出版作者通过KDP(KindleDirectPublishing,作者可以绕过出版社直接在Amazon上发售电子书)平台发布,通过KDP平台发布时,作者只需要上传Word文档,其他的事情也是Amazon官方来做,从而保证了mobi文件的规范程度。
ODF开放文档格式(英语:OpenDocumentFormat,简称ODF),全称用于办公室应用程序的开放文档格式(OpenDocumentFormatforOfficeApplications),是一种规范,基于XML的文件格式,因应电子表格、图表、演示稿和文字处理文件等电子文件而设置。它的规格原本由太阳微系统开发,标准则由OASISOpenDocumentFormatforOfficeApplications(OpenDocument)TC(又称为OASISODFTC)[]所开发。存在一个自由与开放的OASIS标准,以ISO/IEC国际标准发布──《ISO/IEC:OpenDocumentFormatforOfficeApplications(OpenDocument)v1.》
PDF(.pdf)PDF(英文全名:PortableDocumentFormat,意思即系“便携式文件格式”)系AdobeAcrobat输出得到嘅一种文件格式。它嘅优点在于跨平台、能够保留文件原有嘅格式(layout)、开放标准,能够免版税(royalty-free)自由开发PDF相容软体。
SEPSEP是中文平台上通用的、优秀的、安全可靠的文档分发和交换格式,基于书生公司达到国际先进水平的技术构建,已历经版式技术、数字纸张技术发展到了智能文档技术。
SEP符合传统纸张特性,可用于将基于纸张的应用e化。每一个SEP文件都相当于若干页纸张文档,并能附加很多数字特性和智能特性。SEP软件可以完整地原版原貌地转换各种来源的应用程序所生成的电子文档,对文字、图像、图形、文档布局等都可以完整地保留。书生SEP文件采用先进的分类压缩方式,对于图像、文字、图形、影像等都采用了相应的先进压缩算法,使得电子文档的共享、交换和归档变为一件轻松愉快的事情。免费使用的书生SEP阅读器,和超过万份以上的各式SEP电子文档的广泛使用保证了该技术易用和稳定。采用SEP文件格式及SEP家族系列文档格式的书生软件产品,为政府与企事业单位的文档一体化工作和电子政务建设提供了值得信赖的文档解决方案。
STKSTK文件格式是宜锐公司开发的电子书格式,需要使用该公司的掌上阅读器STAReBOOK以及eREAD来阅读。eREAD阅读软件集成了书籍制作功能,用户可以亲手制作自己的书籍,符合了用户分享图书的需求,网络上免费的STK图书,大部分都是读者自己制作并在网络上传播的。
TCR(.TCR)阅读器文本压缩是为在0世纪90年代使用的Psion公司3系列平台开发的电子书格式。该格式包含文本及其格式参数。该电子书格式专门用于Psion公司的设备。
TIFF标签图像文件格式(TaggedImageFileFormat,简写为TIFF)是一种灵活的位图格式,主要用来存储包括照片和艺术图在内的图像。它最初由Aldus公司与微软公司一起为PostScript打印开发。TIFF与JPEG和PNG一起成为流行的高位彩色图像格式。TIFF格式在业界得到了广泛的支持,如Adobe公司的Photoshop、TheGIMPTeam的GIMP、UleadPhotoImpact和PaintShopPro等图像处理应用、QuarkXPress和AdobeInDesign这样的桌面印刷和页面排版应用,扫描、传真、文字处理、光学字符识别和其它一些应用等都支持这种格式。如今Adobe公司从Aldus获得了印刷应用程序-PageMaker之后控制着TIFF的规范。
术语“TaggedImageFileFormat”或者“TagImageFileFormat”在一些早期的TIFF规范中是作为副标题存在的。目前的TIFF规范TIFF6.0不再使用这些术语,现在的名字仅仅叫做“TIFF”。
TIFF最初的设计目的是为了年代中期桌面扫描仪厂商达成一个公用的扫描图像文件格式,而不是每个厂商使用自己专有的格式。在刚开始的时候,TIFF只是一个二值图像格式,因为当时的桌面扫描仪只能处理这种格式。随着扫描仪的功能愈来愈强大,并且桌面计算机的磁盘空间越来越大,TIFF逐渐支持灰阶图像和彩色图像。
文本文件(.txt)文本文件一般指只有字符原生编码构成的二进制计算机文件,与富文本相比,其不包含字样样式的控制元素,能够被最简单的文本编辑器直接读取。
.txt是包含极少格式信息的文字文件的扩展名。.txt格式并没有明确的定义,它通常是指那些能够被系统终端或者简单的文本编辑器接受的格式。任何能读取文字的程序都能读取带有.txt扩展名的文件,因此,通常认为这种文件是通用的、跨平台的。
在英文文本文件中,ASCII字符集是最为常见的格式,而且在许多场合,它也是默认的格式。对于带重音符号的和其它的非ASCII字符,必须选择一种字符编码。在很多系统中,字符编码是由计算机的区域设置决定的。常见的字符编码包括支持许多欧洲语言的ISO-1。
由于许多编码只能表达有限的字符,通常它们只能用于表达几种语言。Unicode制定了一种试图能够表达所有已知语言的标准,Unicode字符集非常大,它囊括了大多数已知的字符集。Unicode有多种字符编码,其中最常见的是UTF-8,这种编码能够向后兼容ASCII,相同内容的的ASCII文本文件和UTF-8文本文件完全一致。
用文本编辑器打开一个文本文件后,用户可以看到可读的纯文本内容。控制字符有时被编辑器当做文字指令,有时被当做像纯文本那样可编辑的转义字符。尽管文本文件里面有纯文本信息,但是通过特殊方法,文件内的控制字符(尤其是文件结束字符)可以让纯文本不可见。
RTF富文本格式(RichTextFormat)即RTF格式,又称多文本格式,是由微软公司开发的跨平台文档格式。大多数的文字处理软件都能读取和保存RTF文档。
作为微软公司的标准文件,早期外间需要向微软付款数十美元,才能购买一本薄薄的RTF标准文件。不过随着采用RTF格式标准的软件愈来愈多,RTF格式也愈来愈普遍,微软公司就把标准文件公开,放在网上供开发者下载。
UMD(.umd)UMD:手机电子书格式,是UniversalMobileDocument的简称。因其压缩比例高,支持多种功能,很多电子书被做成UMD格式。NokiaSymbian平台的掌上书院,百阅,Qreader,熊猫看书支持打开UMD格式电子书,如JME的其他移动软件平台也有阅读UMD的客户端软件。
UMD格式由
k北京治疗白癜风大约多少钱白癜风治疗最好的药