什么样的网页适合用本扩展来保存,什么不适合?
通常来说,那些只包含图文的内容适合使用 MaoXian 来保存,如:博客文章、新闻、论坛帖子等等。
而包含大音频,大视频的网页是不适合的。因为这类网页的主内容为这些大音频和大视频,虽然 MaoXian 确实可以保存音频和视频,但其界面设计并不适用于此类网页,如果你尝试去保存这类网页,往往会发现 MaoXian 一直卡在保存中,并最终失败。请寻找其他专用工具。
流媒体类网页也是不适合的,如:直播,电台等。
另外,如果你寻找的是保存一批文章,比如某个博客的所有文章。MaoXian 也是不适合的,你可以寻找其他具有爬取功能的工具(如 wget)。
扩展会保存哪些内容?
MaoXian 的裁剪过程,裁剪的是当前状态下的网页。主要的裁剪内容为文本信息和图片,具体的存储内容会因存储格式的不同而不同,并且有些内容需要在设置页面勾选才会保存。如下:
若存储格式为 HTML
会保存的内容
- 选区的文本
- 选区的图片
- 网页的样式
- 内嵌的网页 (iframe)
- 背景图(默认未保存)
- 网页图标(默认未保存)
- 网页字体(默认未保存)
- 声音(默认不保存)
- 视频(默认不保存)
- 画布节点(canvas,尝试保存当前状态为图片)
- embed 节点 (默认只保存图片)
- object 节点(默认只保存图片)
- applet 节点(默认不保存)
不会保存的内容
- 网页脚本 (即:javascript)
- 不显示的元素
若存储格式为 Markdown
会保存的内容
- 选区的文本
- 选区的图片
不会保存的内容和 HTML 一样,外加上不会保存网页样式。
为啥我在 Windows 上的 Chrome,安装过后无法启用
请看安装页面的 在 Chromium 类浏览器上安装 > 安装说明
为啥我在 MacOS 上的 Chrome, 安装过后无法启用
请看安装页面的 在 Chromium 类浏览器上安装 > 安装说明
如何设置快捷键
由于浏览器提供了统一配置快捷键的页面,所以你可以在浏览器的扩展管理页面找到配置入口,如下:
- 在火狐浏览器上,
在地址栏输入 about:addons > 回车 > 点击小齿轮 > 管理快捷键
- 在谷歌浏览器上,
在地址栏输入 chrome://extensions/shortcuts > 回车
为什么浏览器提示:该扩展程序未列在 Chrome 应用商店中,并可能是在您不知情的情况下添加的?
由于该 MaoXian 确实没有在 Chrome 应用商店上线,所以浏览器提示这个是正常的,是不影响使用的。关于 “并可能是在您不知情的情况下添加的” 这个您需要自己判断你的软件包是否是从 MaoXian 网站上下载的,以及是否是由你自己触发的安装,如果两者都没问题,那你安装的软件包应该没有问题,请忽略该提示就好。
为什么点击裁剪后,弹出好多选择保存路径的窗口
默认情况下,本扩展会利用浏览器的下载功能,保存裁剪下来的网页。因为网页通常包含一些样式,图片等文件,所以每次裁剪需要保存多个文件。如果你的浏览器设置了“每次下载都询问保存位置”,那么浏览器就会弹出多个窗口询问你“这些文件要保存在哪里”。
关闭谷歌的 ‘每次下载都询问保存位置’ : 从浏览器地址栏输入 chrome://settings/downloads
> 下载 > 取消选中 『每次下载都询问保存位置』
关闭火狐的 ‘每次下载都询问保存位置’ : 从浏览器地址栏输入 about:preferences
> 回车 > 下载 > 取消选中『每次下载都询问保存位置』
为什么有的网页裁剪下来后,本来是图片的地方变成空白的图片(或者只有一部分内容有图片)
有些网页为了节约流量,会对网页上的图片加上「懒加载」机制。这些网页的图片只有用户浏览过(即图片出现在屏幕上过)才会加载,而那些没有浏览过的图片会用一张空白的图片占位。
因为本扩展裁剪的是当前状态的网页, 所以当你没有完全地浏览过网页的内容时,就进行裁剪,就会出现下载到空白的占位图片。对于这类具有「懒加载」机制的网页,你应该先浏览一遍(即以适当的速度从头滚动到尾),让该加载的资源先加载完全,再进行裁剪。
为什么裁剪结束后,图片没有存储到设置的路径,而是在浏览器的默认下载文件夹下,而且文件名也不对
本扩展默认使用的是浏览器来下载裁剪下来的文件,当发给浏览器的下载请求,被其他扩展拦截了,并把文件名给改了,就会发生这个问题。
你可以到 设置 > 浏览器
页面,点击『测试』按钮进行确认。 确认过后,你可以尝试一个一个地停用可能具有下载功能的扩展,再去测试,以找出冲突的扩展。
遇到这个情况可向对应扩展的开发者反馈问题,因为一个扩展拦截了另一个扩展的下载请求,这显然是不合理的。
如果你无法解决冲突的问题,则可以使用我们开发的一个本地程序来绕过这个问题。 详情见: 本地程序
注:有些浏览器会开发自己的下载管理功能,也会与 MaoXian 产生冲突。
打开裁剪结果,发现一些图片下载失败,该怎么办?
在网络环境恶劣的时候,会发生这个情况,请根据页面的提示,到【失败的下载任务】页面进行重新下载即可。如果你确保了非网络环境问题而导致的一直下载失败,则请把问题反馈给开发者。
为什么需要那么多权限
请查看隐私说明页面
点击了裁剪,没有反应
请依次检查以下情况:
- 如果你刚安装完扩展,那些在安装前就已经打开的网页得刷新后才能裁剪。
- 如果不是第一种情况,也请尝试刷新网页,再试一下(有时候浏览器会抽风,导致某些资源无法正常加载)。
- 目前 MaoXian 只兼容
Chromium
和Firefox
, 其他浏览器不保证能正常工作。有的用户可能会使用基于Chromium
开发的浏览器(如:vivaldi),该类浏览器很可能可以正常工作,但我们无法作出保证。
卡在了「裁剪中…」
一种情况是网络很不好,MaoXian 卡在某个请求了,可能这个请求根本就没有可能成功。比如万恶的墙对某些请求进行干扰,导致数据一直下载不下来。
你可以到 设置页面 > 高级 页面,调整请求的「超时时长」为 15 秒,设置「重试次数」为 1。再刷新网页,重新进行裁剪,如果你等了一分钟以内,整个流程可以走下去,就说明是网络的问题了。那么没别的较好的办法,你只能去行正义之事了(搭梯子科学上网)。
目前还发现裁剪 wikipedia 网页时候,当网页上有很多个用图片表示的公式时,MaoXian 的裁剪过程很慢,也会呈现出卡住了这种状态。这种就只能等了。
卡在了「保存中…」
情况一: 网络环境不好
MaoXian 在保存图片的时候,如果遇到网络环境太差,一个图片下了好久都没有下载下来,会发生请求超时的情况,MaoXian 会进行重试,而导致整个保存过程变得很长,保存进度长期没有更新,就会感觉到卡住了。
如果你被墙干扰了,那么没别的较好的办法,你只能去行正义之事了(搭梯子使用魔法上网)。如果你的网络环境太差与墙无关,只是速度不太快, 你可以到 设置页面 > 高级 页面,把「请求时长」设置为更大的值,以减少超时重试的情况,然后在裁剪网页的时候,不要着急,起来喝杯茶水。
情况二: 与其他扩展发生冲突了
如果你使用的是浏览器来下载裁剪下来的文件(默认情况),那么浏览器发出的下载请求有可能被其他扩展拦截了。你可以到 设置 > 浏览器
页面,点击“测试”按钮进行确认。
确认过后,你可以尝试一个一个地停用可能具有下载功能的扩展,再去测试,以找出冲突的扩展。
注:有些浏览器会开发自己的下载管理功能,也会与 MaoXian 产生冲突。
遇到这个情况可向对应扩展的开发者反馈问题,因为一个扩展拦截了另一个扩展的下载请求,这显然是不合理的。
如果你无法解决冲突的问题,则可以使用我们开发的一个本地程序来绕过这个问题。 详情见: 本地程序
改变默认的下载路径
方法一:修改『本地程序』配置
如果你采用「本地程序」的方式保存信息的话,直接修改配置文件,再重启一下浏览器就可以了。
注意:如果你只为了修改下载路径,则完全没有必要去安装『本地程序』(可参考下方的方法二)。
方法二:创建传送门
如果你采用的是 「浏览器下载功能」来保存信息的话,由于安全问题,浏览器扩展无法修改浏览器的下载路径。但是你可以通过创建软链接(符号链接),来达到你的目地。
软链接(符号链接)可以理解为一个传送门,即你把文件存在这个传送门里面,文件会被传送到(被保存到)另一个你指定的文件夹。
下方的例子中:
- MaoXian 的根目录,指的是 MaoXian 的存储入口(文件夹),可以在 MaoXian 的设置页面进行更改,默认值为 “
mx-wc
“。 - 浏览器的下载路径,是你每次下载文件,浏览器默认的存储入口,这个可以在你浏览器的设置页面找到对应的路径。
- 目标路径,即你实际上想把文件存储到这个路径(文件夹)下。
例一:在 Windows 上创建传送门
假设:
mx-wc
【MaoXian 的根目录】C:\Users\jack\Browser\Downloads
【浏览器的下载路径】C:\Users\jack\OneDrive\web-clippings
【目标路径】
(1)把你的目标路径准备好,即创建对应的文件夹。
(2)查看浏览器的下载目录,如果已经存在【MaoXian 的根目录】,则把里面的内容处理掉(剪切到目标路径,或直接删除), 再把这个【MaoXian 的根目录】删除。因为我们后面要在此处创建一个名字一样的传送门。
(3)在浏览器的下载路径下,创建一个传送门来作为 MaoXian 的根目录。该传送门的名字必须和【MaoXian 的根目录】是一样的,此例子中,这个传送门的名字是 “mx-wc
“。
Windows 上,创建软链接的命令为:
mklink /D C:\Users\jack\Browser\Downloads\mx-wc C:\Users\jack\OneDrive\web-clippings
新建一个 bat 文件,如:maoxian_chuan_song_men.bat 文件(文件名随便取) ,再把上方的命令复制进该 bat 文件(根据你的需求修改最后的两个路径),保存后, 再右击该文件,以管理员方式运行,运行后,传送门即创建成功。
你可以在浏览器的下载目录里看到有一个叫做 “mx-wc
” 的文件夹,它即是我们刚刚创建的传送门。你可以试着在它里面随便创建一个文件,再到目标路径里面去验证是否已经传送过去。如果是,恭喜你,你已经成功修改了 MaoXian 默认的存储路径,并且学会了创建传送门这个黑客技术 :P
例二:在 Linux/Mac 上创建传送门
假设:
mx-wc
【MaoXian 的根目录】/home/jack/Browser/Downloads
【浏览器的下载路径】/home/jack/Dropbox/web-clippings
【目标路径】
(1)把你的目标路径准备好,即创建对应的文件夹。
(2)查看浏览器的下载目录,如果已经存在【MaoXian 的根目录】,则把里面的内容处理掉(剪切到目标路径,或直接删除), 再把这个【MaoXian 的根目录】删除。因为我们后面要在此处创建一个名字一样的传送门。
(3)在浏览器的下载路径下,创建一个传送门来作为 MaoXian 的根目录。该传送门的名字必须和【MaoXian 的根目录】是一样的,此例子中,这个传送门的名字是 “mx-wc
“。 运行下方命令即可创建:
ln -s /home/jack/Dropbox/web-clippings /home/jack/Browser/Downloads/mx-wc
例三:创建多个传送门(高级)
利用传送门这个操作系统自带的功能,我们可以解决更复杂的需求。比如利用 MaoXian 在裁剪时可以选择分类这一特点,为不同的分类创建不同的传送门,以实现不同的分类保存在不同的地方。
比如:
下方格式为: 【传送门】===> 【目标路径】
/home/jake/Browser/Downloads/mx-wc/read-later ===> /home/jake/xxNote/read-later
/home/jake/Browser/Downloads/mx-wc/news ===> /home/jake/news-reader/clippings
/home/jake/Browser/Downloads/mx-wc/todos ===> /home/jake/obsidant/todos
在这个例子中,”mx-wc
” 这个【MaoXian 的根目录】为普通文件夹,而 “mx-wc/read-later
“、”mx-wc/news
” 和 “mx-wc/todos
” 这三个传送门分别对应不同的目标路径。于是在使用 MaoXian 的过程中,就可以通过选择不同的分类,把文件放进去不同的传送门,即保存在不同的目标路径。
我不想保存元信息文件
元信息文件是 MaoXian 对裁剪下来的文件的一个识别入口,是许多功能的依赖文件(如:裁剪历史,重置历史等..),如非特别需要,还是建议保存此类文件。
警告:当你取消了元信息文件的保存后,表示你期望通过其他软件来查看和管理你裁剪下来的文件。那些依赖元信息文件的功能将无法识别你裁剪下来的文件(如:裁剪历史,重置历史等..)。
修改方式如下:
进入扩展的 设置页面 > 重置与备份 ,确保 ”设置页面的配置信息“ 这一项有勾选后,点击 ”备份设置到文件“ 后得到一个 JSON 文件。使用文本编辑器打开它,使用 saveInfoFile
这个关键字查找,把查找到那一行冒号后面的值修改掉(true
为保存,false
为不保存)。修改完成后,再点击 ”从文件中恢复“ ,选择刚才导出的文件,导入成功后,修改即生效。
无法打开以前裁剪的内容
有的朋友可能发现,我刚裁剪下来的文件可以打开,可过几天就打不开了。
这个是因为扩展在无法访问你本地网址的时候,会尝试通过下载历史打开文件,当浏览器的下载历史被清空(可能是你主动清空的,也可能是浏览器重启后清空的)时,扩展找不到办法打开你的文件了。
可以通过允许扩展访问本地网址, 来避免这个问题。
允许访问本地网址
浏览器默认不允许扩展访问本地网址,这会导致本扩展无法直接打开裁剪下来的文件,不能让用户直接点击裁剪历史里面的链接就能查看。
我们建议你允许本扩展访问本地网址,这样你在裁剪历史页面就能更方便地查看裁剪下来的内容,使用起来会方便许多。
本节介绍了如何让浏览器允许 MaoXian 访问本地网址(file://打头的网址)
1. 获取 “扩展标识”
从 MaoXian 的设置页面,在“本地网址” 一节中找到扩展标识
信息。
不同的浏览器拿到的 扩展标识
不同,如下例子:
- Firefox => moz-extension://612ab18c-c29e-4211-bd50-3f208d227db7
- Chrome => chrome-extension://612ab18c-c29e-4211-bd50-3f208d227db7
2. 更改浏览器设置
这一步,不同的浏览器设置方式不一样。
Chrome/Chromium
以上面的扩展标识为例子,只要在地址栏输入chrome://extensions/?id=612ab18c-c29e-4211-bd50-3f208d227db7
, 回车。
找到 允许访问本地文件/网址
这一选项, 启用它就可以了。
Firefox
FireFox 默认没有提供一个页面可以设置这个选项,但可以通过修改浏览器的配置项,来达到目地。
具体方法如下:
I: 在地址栏输入 about:config
并回车, 进入配置项页面 (可能会有一个警告页面,直接点击按钮进入就好了)。
II: 配置以下三项
条目名称 | 值 | 提醒 |
---|---|---|
capability.policy.policynames | localfilelinks | - |
capability.policy.localfilelinks.sites | moz-extension://612ab18c-c29e-4211-bd50-3f208d227db7 | 这个值,你应该使用自己拿到的 扩展标识 , 如果你允许多个扩展的话,这里用空格隔开 |
capability.policy.localfilelinks.checkloaduri.enabled | allAccess | - |
这样操作:
复制条目名称,粘帖到搜索栏进行搜索, 如果搜索到,就双击修改它的值就行了。
如果没有搜索到,就鼠标右键 > 新建 > 字符串(String), 把条目名称
和值
依次粘帖进去即可。
3. 更改本扩展中的设置
回到 MaoXian 的设置页面,把 基础设置 > 我设置好了 ‘允许插件访问本地文件路径’ 复选框 打上勾。
浏览器弹出提示框提示:脚本无反应,询问是否中止
目前在一些大的网页(网页上可能有成千上万个元素),会偶尔发生此种情况。若遇到此种情况,请选择「继续等待」就行了(可能需要多确认几次)。
能把网页裁剪成单个文件?比如:裁剪成 mhtml、zip 或者 存成图片
MaoXian 无法把网页裁剪成单个文件,也不打算支持该功能。
MaoXian 支持的两种格式 HTML 和 Markdown,都是简单的文本文件。文本文件格式简单,没有特殊的编码,这使其容易修改,且可搜索性强。这是那些特殊编码的单个文件所无法比拟的,比如图片,你要搜索其内容中的文字,几乎不可能。zip 也是如此,查看不方便,搜索也是极难。对于 mhtml 来说,并非所有浏览器都支持这种格式。再者,文本文件的简单性使你可以很容易地对其进行解析,转换。比如导入到其他软件中,或者把其转换成更复杂的格式,比如把你裁剪下来的所有网页转换成电子书(epub,pdf 等)。种种的灵活性,使其非常适合作为一种独立于软件的存储格式。
当然,你很可能还是偏好于单文件格式,那么可以尝试下这些优秀的浏览器扩展,它们是: webscrapbook ,savepageWe, singleFile。
为什么扩展不在「谷歌商店」上线
请查看这里
该软件会泄露我的隐私吗?
请查看隐私说明
反馈问题、提建议、寻求帮助
请查看这里