晋江取V文在我看来有三种方式:
方法一:用软件直接抓取为txt文件
网络取书、魔爪都能达到这一目的,但有时候由于总总原因,网络取书与魔爪均有罢工的时候,耐心好的,可以等它们正常再使用,耐心不好的,只有另想它法了。
注意在使用网络取书时,“参数设置”中设置取书后文件保存的路径,且一定不要勾选“使用旧模式对晋江文进行处理”,因现在晋江V文已经采用了FLASH方式防盗,无法用旧模式取文了。
另外,还可用电脑版的WAP浏览器WAPopera7.06来抓取txt文件。
WAPopera7.06压缩包内有三个文件:Chinese.lng中文语言包;o760tp1v 7141.exe英文版安装文件;sn.txt软件注册号。
首先单击o760tp1v 7141.exe安装软件;
然后注册软件,单击“help”中的“Register Opera”,输入sn.txt中的软件注册号;
最后安装中文语言包:
1、将压缩包中的Chinese.lng文件复制到安装目录中(默认安装的话就是C:Program FilesOpera76)
2、单击“tools”中的“preferences”,出现“preferences”对话框中选择“Languages”,在“User interface language”框中复制“C:Program FilesOpera76Chinese.lng”后,单击“Apply”按钮后,单击“OK”按钮。
打开已安装好的中文版opera,新建页面,输入晋江的WAP地址“wap.jjwxc.net”,晋江文学城手机版就出现了,由于手机阅读的是纯txt版本,直接复制就可以了。
方法二:用OCR软件将图片转换成txt文件
OCR软件文通慧视能进行屏幕识别,可直接将将晋江V文网面视为图片文件扫校成txt文件。
由于文通慧视体验版3.1.1.10有时间限制,所以必须安装补丁才能正常使用。
其安装方法为:
1、解压缩后,双击SmartVisionsetup.exe,正常安装程序。
2、将Crack.rar补丁解压缩至文通慧视的安装目录(默认目录为C:Program FilesWintoneSmartVision)。
OCR方法:
1、双击安装目录下的破解补丁FullScr32-CR.exe,即可进入程序。
2、点击“慧视屏幕”
出现带红十字的鼠标,选择OCR范围后,出现“屏幕识别”对话框
如果是OCR晋江的图片文字,语种选择“简体”;如果是OCR起点的图片文字,选择“手体”。选择好后,点击“确定”按钮,出现OCR进度条,最后出现OCR出来的文字。当然OCR出来的文字肯定与原文有差别,这就需要细心校对了。
注意:该程序不能从程序中直接退出,否则下次无法正常使用。退出方法有两种:
1、使用Ctrl+Alt+Del,调出Windows任务管理器,选择FullScr32-CR.exe后点击“结束进程”,选择simocr.exe后点击“结束进程”。
2、让程序一直运行,直至关机。这种方法是最便捷的。
除了文通慧视外,还有其他OCR软件,如清华紫光、汉王、尚书等等,只是这些软件只能直接扫校图片,所以使用它们的时候,需要先抓图,才能扫校。
傲游浏览器就有抓图功能,单击“工具”-“屏幕截图”-“当前页面截图”即可,保存的图片格式建议选择JPEG(如果不用于扫校只用于网络传输建议选择PNG)。
抓出的图片非常大,而且有盛大ID(客户号)这类不宜公开的东东。
需要用photoshop矩形选框工具选择需要的部分,先单击“编辑”-“拷贝”,单击“文件”-“新建”-“好”,再单击“编辑”-“粘贴”, 最后单击“文件”-“存储”。
方法三:查看源文件,将其中的图片替换成文字(由于晋江V文新采用Flash方式防盗,已经无法用此法取V文)
在需要取文的网页上右击,出现的菜单中选择“查看源文件”
出现该文的txt源文件
单击“编辑”-“查找”,在“查找内容”中输入正文中的第一个字,比如《天后站》第四十一章正文的第一个字是“脖”(有可能第一个字是图片,换第二个字也成)
从正文内容第一个字起,按shift键至正文结束(正文结束有个很明显的标志“插入书签”)。
单击“编辑”-“复制”。
打开文本编辑软件EmEditor8.06,新建一文件,再粘贴刚才复制下来的源文件。
文中“脖子下方”后内容,“<”与“>”之间便是一个图片的代码,为方便观看,将重复无用的代码
“<img align="bottom" style="margin-bottom:-2px" src=http://my.jjwxc.net/gdc/gdcv.php?c=”
切记是到第一个“%”前的东东,全部替换为空字符,即替换内容为空(“搜索”-“替换”),替换后变成清爽的文字。
将源文件与图片文件对照,“%57%DE%12%A4%AE%E6%94">”全部替换为“的”字。
以此类推,即可将那些图片代码替换成文字,唯一需要注意的是源文件中“<br>”是换行符的意思,替换时需要勾选“使用正则表达式”,替换内容为“n”。
替换完所有图片代码及换行代码后保存为txt文件。
[ 此贴被quiet_grass在2011-03-21 10:28重新编辑 ]