2021.7.14更新:
近日有书友反映下载器失效了,究其原因,可能是网页进行了改版导致下载器失效。
于是抽了些时间对下载器进行了更新。同时把下载器下载全本、单卷功能集中到一起,任君选择。界面如下图所示。
食用方法仍与之前一致。
——————————————————————————————————————————–
2021.7.1 更新:
昨天说到,下载单个章节(卷次)功能的下载器,卷次及文件名称会自动命名为网页中的名称,但这个名称往往不是我们需要的,影响阅读。所以今天再次进行更新,可以在下载之前输入自己想要命名的名称,则在下载后,建立的文件夹及文件会自动命名为自己的需要的名称。
——————————————————————————————————————————–
2021.6.30更新:
上次下载器经推出后,承蒙书友的厚爱,得到了不少书友的认可。最近有书友提出希望实现下载单个章节(卷次)的功能,这功能本来是下载器逻辑的一部分,只是没有单独拿出来。既然有人提出需求,那么就再更新一个下载单个章节(卷次)的下载器……
本次没有采用图形化界面,因为上次的界面感觉有点华而不实,遂弃之。能把书下载下来才是王道嘛!
同样的操作方式,只是输入的链接有点区别,不是输入“Catalog Record”里面的链接,而是输入“Full View”里面的链接(见下图上方)。这点要注意!同样地,可以下载image或pdf两种格式。
PS:在win7系统下,在窗口中不能直接用ctrl+V快捷键粘贴链接,要采用如上图方式进行粘贴(在下载器上方,鼠标右键,依次选择编辑/粘贴)。输入image或pdf时则直接输入即可。
两个要素输入后,会自动在本下载器同路径生成一个“HathiTrust Digital Library”文件夹,所有下载的文件会按章节(卷次)名建立文件夹,下载的文件会在里面。章节(卷次)名以及文件会以网页内左侧的名称(见下图左侧)来命名,比较遗憾的是这个名称往往是拼音或其他表现形式,而不是中文。
下载文件过程中同样会出现超时等现象,如果发现有漏下的情况,只须重新运行下载器,输入同样的链接及文件类型即可,下载器会跳过已经存在的文件,对漏下文件进行补下。
——————————————————————————————————————————–
此前与书友聊起下载书籍事宜,得知“HathiTrust Digital Library”(https://www.hathitrust.org/)这个网站拥有丰富的书籍资源,并且对外免费开放,只是下载不便。正好识得编程皮毛,本着提升技术及方便书友的初心,遂尝试写了一个下载器。经过一段时间的努力及若干书友的测试,下载器终于勉强算是完成了,虽然仍有不如意的地方,但总算能够实现下载功能。今天将它分享出来,以供需要者之需。
下面简单介绍一下下载器的使用方法及注意事项,以减少使用中出错的可能。
一、获得下载链接及选择下载文件类型
1.打开网站HathiTrust Digital Library主页(https://www.hathitrust.org/),如下图所示,在箭头处的搜索框输入想要搜索的书籍(由于是国外的网站,有时要用繁体或英文、拼音尝试搜索),然后点击“Search HathiTrust”进行搜索。(注意,搜索框下面的“Full-text”及“Catalog”选项应该会影响搜索结果,大家可以尝试一下有什么不同效果)
2.在上一步中,以搜索“西厢记”例,来到下载这个界面。假设,下面这本书就是我们要的书籍,它有两个链接,分别是:“Catalog Record”和“Full View”。可以分别点击进去看一下,有什么区别。
“Catalog Record”标签点击进去的界面如下:
“Full View”标签点击进去的界面如下:
可以发现,“Catalog Record”标签页相当是该书籍的目录页,里面记载了书籍的基本信息、分卷情况以及每卷的访问链接。
“Full View”标签页则是某卷的具体内容,里面有该卷的总页数,以及可以选择pdf、txt、image三种格式进行下载。不过如果在这里下载的话,则只能一次性下载一张。这显然是一项很麻烦的工作。
二、下载器界面
如上图,下载器有两个界面,上一个是输入下载页链接及下载文件类别的界面,下一个是显示下载进度等其他信息的界面。
三、下载器的操作
下载器界面中,其中一个界面文本框内可以输入书籍链接。刚刚说了,如果在原网址上下载,每次只能下载一页,这种慢效率的方法显然不可取,我们又了解到在 “Catalog Record”标签中,罗列了书籍的基本信息及分卷情况。所以本着最简便的原则,我们当然想一次性自动把该书籍的所有卷次下载下来。所以在下载器界面中输入链接的文本框是输入“Catalog Record”标签页的链接,输入“Full View”标签页的链接是无效的。切记!
另外,上面在“Full View”标签页中可以看到,下载的文件格式有pdf、txt、image三种,这里实现了下载pdf及image格式文件的功能,所以下载器界面中第二个文本框中,则输入pdf或image,输入其他字符也是无效的。(建议优先下载image格式,下载器对pdf格式的下载支持不算友好,部分pdf文档下载下来没有内容,打不开)。
如下图所示:
然后点击“开始下载”,就可以愉快地下载该书籍了。下载界面进度等其他信息在另一个界面,请留意观察。
四、下载的文件
下载之初,下载器首先会在下载器同路径下新建一个叫“HathiTrust Digital Library”的文件夹,所有下载的书籍都会按照书籍名、卷次名依次放在这个文件夹内。
书籍的命名规则是抓取“Catalog Record”标签页中的书籍名,卷次命名规则也是“Catalog Record”标签页中的卷次名,每卷次文件夹中的文件命名是按照“卷次名”+“序号”的原则。虽然阅读起来不够直观,但后续如果用类似adobe acrobat软件合并成pdf倒是很方便,因为它们按照顺序排序的,倒不担心会出错。
五、若干说明
1.关于杀软报毒问题。据反馈360会误报病毒,这个只能保证此下载器确实没有病毒,如果介意的话,请考虑清楚再使用。
2.关于响应超时问题。在下载过程中,如果尝试下载某一页超过设定的时间,则会判定该页响应超时,则自动开始尝试下载下一页,这意味着这一页在本次下载并没有下载下来。
3.下载过程中关闭下载器的问题。在下载过程中,如果关闭了下载器,也无须担心,只需要再次运行下载器,输入正确的链接及相同的文件格式(如image),则下载器会智能跳过此前已经存在的图片或pdf,快速来到没有下载的地方,继续下载。同理,针对响应超时的情况,则只要再次运行下载器,它就能执行补下载操作。
4.个人水平有限,下载器难免有不足之处,如发现问题,可到古书网与本人联系。
5.本下载器仅作为交流之用,请勿用于商业用途,请于下载24小时内删除。
六、下载器下载链接
附件上下载器链接
有需要联系v;hx-hx3
摘要:本文围绕“HathiTrust Digital Library 图书馆书籍下载器丨停止更新,不能使用”这一话题展开讨论,首先简要回顾了HathiTrust Digital Library图书馆的背景和功能,接着分析了为何该书籍下载器会停止更新并无法继续使用的原因。文章重点阐述了停止更新的影响,包括对用户的影响、对学术研究的影响、对技术开发者的挑战以及对图书馆和数字化资源发展的影响。此外,文章还从历史背景、法律和技术角度探讨了这一问题的复杂性。最后,通过对这一事件的总结,本文尝试为未来数字图书馆的发展提供一些思考。
1、HathiTrust Digital Library的概述与背景
HathiTrust Digital Library(HathiTrust数字图书馆)是一个由全球多个学术机构合作创建的数字图书馆。该项目的主要目标是将学术文献、历史文献、以及公共领域的书籍数字化,方便全球读者进行远程访问。HathiTrust的文献资源涵盖了从古籍到现代学术研究的广泛领域,对于学术界来说是一个不可或缺的资源平台。
该图书馆的特点之一是它为用户提供了书籍的全文搜索功能,使得研究人员和学者能够在海量资料中迅速找到相关信息。此外,HathiTrust还通过合作协议,与各大高校和图书馆共享资源,从而不断扩大其数字馆藏。然而,由于该图书馆的版权问题,其部分书籍只能提供预览或有限的内容访问。
随着数字化技术的快速发展,HathiTrust不断进行技术更新和平台优化,旨在提供更好的用户体验。然而,正是在这一背景下,HathiTrust的书籍下载器却遭遇了停止更新的命运,这一事件引起了广泛的关注。
2、停止更新的原因与背景
HathiTrust图书馆书籍下载器的停止更新,主要原因与版权和法律问题密切相关。HathiTrust作为一个数字图书馆,其运营必须遵循严格的版权规定。许多书籍和资料的版权仍归出版商或作者所有,因此HathiTrust必须平衡自由访问和版权保护之间的关系。这一平衡的复杂性使得平台在某些时候不得不限制某些功能的使用。
另一个关键原因是技术更新的需求。随着网络技术、存储技术和安全技术的不断发展,HathiTrust需要对其平台进行不断的技术升级。然而,这些升级并非总是能够兼容原有的书籍下载器功能。为了确保平台的稳定性和安全性,开发者选择停止更新下载器,而将精力集中在平台的其他功能优化上。
此外,HathiTrust与各大版权持有者之间的合作关系也经历了一些波动。这些波动影响了图书馆对下载器功能的开发和支持。部分版权方对数字化资料的传播有着更为严格的控制要求,这使得HathiTrust不得不重新审视其下载功能的可行性和合规性。
3、停止更新带来的影响
首先,停止更新对用户体验造成了直接影响。原本依赖下载器批量获取书籍的用户,尤其是学者和研究人员,面临了无法下载所需资料的困境。这对于需要大量文献支持的学术工作,尤其是在学术研究、论文撰写等方面造成了障碍。许多用户在短时间内难以适应这一变化,从而影响了他们的研究进程。
其次,停止更新对学术研究的影响也不容忽视。HathiTrust的数字图书馆长期以来为全球学术界提供了丰富的资源,尤其是在历史文献和稀缺资料的数字化方面,HathiTrust的作用不可替代。若无法通过下载器快速获取资料,研究人员可能需要转向其他平台或进行手动搜索,增加了时间成本和资源利用的难度。
对于技术开发者而言,停止更新也意味着一种技术上的挑战。书籍下载器的停止使用,可能导致一些依赖这一工具的第三方应用无法继续运作。开发者不得不寻找替代方案,或者调整已有的技术架构,这不仅需要额外的时间和精力,也可能带来技术难题。
4、对图书馆和数字化资源的影响
图书馆作为知识的守护者,在推动知识共享和资源开放方面起着至关重要的作用。HathiTrust的下载器停止更新,意味着图书馆的某些功能受到限制,这对于图书馆在全球数字化进程中的定位带来一定影响。虽然HathiTrust依然提供在线阅读和搜索等功能,但下载功能的限制使得部分用户的需求无法得到完全满足。
另一方面,这一事件引发了对数字化资源管理的深层次思考。数字化图书馆不仅需要处理版权、技术和法律问题,还要面对如何保障资源长期可访问的问题。HathiTrust的这一事件使得人们更加关注数字图书馆在未来发展过程中,如何在保证版权合规的同时,提供更多的便利功能,以满足不同用户的需求。
从长远来看,HathiTrust下载器的停止更新,也可能为未来的数字图书馆发展提供一些启示。在数字化资源不断扩展的今天,图书馆如何应对快速变化的技术环境,如何与版权方协调合作,如何保障用户的需求将成为越来越重要的问题。
总结:
从HathiTrust Digital Library图书馆书籍下载器停止更新这一事件来看,数字图书馆的发展面临诸多挑战,包括版权保护、技术更新和用户需求的平衡。尽管这一事件对部分用户带来了不便,但也促使我们深入思考数字图书馆未来发展的方向。在技术日新月异的今天,数字图书馆不仅要为学术研究提供便利,还需要在版权保护和资源共享之间找到更加合理的解决方案。
总之,HathiTrust作为数字图书馆的重要组成部分,虽然在某些功能上出现了暂时性的停滞,但它仍将在全球学术界扮演着至关重要的角色。未来,随着技术的不断进步和各方的共同努力,数字图书馆将迎来更加光明的发展前景。
本文由nayona.cn整理

联系我们

关注公众号