摘要:是一个简单的在线工具箱,基于进行开发目前支持压缩以及文字提取。文字提取目前支持的语言有英文简体中文繁体中文日文韩文。启动成功后,在浏览器中访问服务器,即可看到前端界面。目前导出格式为。等待完毕后即可下载。
pdftoolbox是一个简单的在线pdf工具箱,基于GhostScript进行开发,目前支持PDF压缩以及PDF文字提取(OCR)。PDF文字提取目前支持的语言有 英文、简体中文、繁体中文、日文、韩文。
简单试用了下,发现还挺有趣,这篇文章还是利用宝塔面板来搭建这个工具,宝塔服务器面板,一键全能部署及管理,送你3188元礼包,点我领取https://www.bt.cn/?invite_code=MV9ub2NxdmI=
项目:https://github.com/lixiaofei123/pdftoolbox
演示:https://halo.vsvs.xyz/(保留一天)
1)准备一台vps,测试教程搭建于ion vps (https://www.daniao.org/tag/ion/)
2)宝塔面板最新版
3)docker管理器
4)nginx1.20
至于其他的东西根据自己需求来安装吧!
1)新建站点,宝塔如何新建站点,略过,
2)新建站点后,顺手把ssl也申请好吧。宝塔如何申请免费是ssl,也略过!
3)Docker一键部署,部署命令如下:
mkdir -p /data/pdftoolbox/inputmkdir -p /data/pdftoolbox/outputdocker run -d --name pdftoolbox --restart=always -p 8082:8082 -v /data/pdftoolbox/input:/opt/pdftoolbox/input -v /data/pdftoolbox/output:/opt/pdftoolbox/output mrlee326/pdftoolbox
注意,默认用的8082端口,如果有冲突,可以自行修改为其他端口,如果搭建好不能访问,请在安全重放行这个端口。
4)启动成功后,在浏览器中访问 http://服务器ip:8082,即可看到前端界面。
1)如何用域名访问,看图:
2)效果,浏览器,访问你的域名,即可看到如下效果。
1)选择上方的【pdf压缩】,然后点击【点击此处上传】按钮,选择要转换的文件,即可上传并压缩。目前支持三种压缩质量。高质量 (300dpi)/中质量 (150dpi)/低质量 (72dpi)!!!
2)选择上方的【pdf压缩】,然后点击【点击此处上传】按钮,选择要转换的文件,即可上传并进行OCR文字提取。目前导出格式为txt。此过程会比较慢,请耐心等待。等待完毕后即可下载。
3)识别结果如下图所示:
整个使用下来,体验还不错,如果你有一些pdf需要处理,可以试试这个项目。
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/121025.html
摘要:如果提示端口冲突,可以自行修改为其他端口使用初始化设置,首次访问需要设置管理员账号密码,根据提示完成即可。完成初始话就可以进入后台,可以根据需要创建监控等等。如果你正在考虑自建一个监控程序,那么可以折腾试试uptime-kuma是一款开源监控工具,类似于Uptime Robot和statping,ui非常简洁美观,支持TCP/PING/HTTP监控等,还支持多语言其中包括中文! 这篇文...
摘要:甲骨文,大家都用了有阵子了,总结起来就是两个字真香,不过日本和韩国因为涌入的太多,线路已经不堪重负。点击创建,默认会自动运行一次,我们点击下载配置,会得到一个压缩包,解压后,会有,用记事本打开,会有你需要的任何信息。甲骨文 ARM,大家都用了有阵子了,总结起来就是两个字真香,不过日本和韩国因为涌入的mjj太多,线路已经不堪重负。特别是韩国区,线路boom已经是常态了。 因为一机难求,所...
摘要:宝塔服务器面板,一键全能部署及管理,送你元礼包,点我领取卸载宝塔的默认宝塔的默认版本是,如果你配置的程序需要更高版本的,那么需要卸载默认的版本。昨天想安装一个halo博客,开始的时候一直安装不上,后来发现jdk版本不对,halo博客默认的jdk版本最低是jdk11,宝塔默认的是jdk1.8,所以这篇文章就来倒腾下如何在宝塔面板环境下卸载默认的jdk1.8,并且安装jdk16。 宝塔服务...
摘要:是由的作者开发的一款监控网络状态和稳定性的开源软件。准备准备一台,这是必须的。不要急于修改网站配置文件和添加。其他方面的修改显而易见,不赘述。SmokePing 是由 RRDtool 的作者 Tobi Oetiker 开发的一款监控网络状态和稳定性的开源软件。SmokePing 会不断向目标发送各种类型的数据包,并对返回值进行测量和记录,通过 RRDtool 制图程序图形化地展示在各个时段内...
摘要:这里的参数同时也支持命令里的时间形式,比如,,表示每天北京时间执行续期任务,如果你不想每天执行任务,只想隔几天执行,只用修改的值即可。使用脚本来自动续期freenom免费域名还是很有必要的,很多童鞋都有几十个免费域名,手动续期真是个体力活。之前的教程因为作者提供的git actions方式导致仓库被封,所以这个方式已经不能使用,好在作者更新了docker,目前我们可以使用docker来部署这...
阅读 2824·2021-10-14 09:42
阅读 1168·2021-09-24 10:32
阅读 2910·2021-09-23 11:21
阅读 2801·2021-08-27 13:10
阅读 3299·2019-08-29 18:41
阅读 2169·2019-08-29 15:16
阅读 1158·2019-08-29 13:17
阅读 865·2019-08-29 11:22