手机浏览器扫描二维码访问
作为一名合格的科研工作者,谢与非首先开始做文献收集工作。
Sci-Hub是用不了了,KI上的文献也不算很多,于是谢与非只好从最基础的做起——先筛选知名小说网站和APP。
不多时就进入到了着名的网文论坛,从中筛选出基本符合要求的平台若干。
然后再细分,哪些网站以霸总小白文见长,哪些受众比较多样化。
接着呢,就是科研狗们最喜欢的收集数据阶段。
谢与非花了两个晚上,研究了各类榜单的排名和更新依据,从论坛里搜集了大量资料,甚至搞明白了几大平台女频的各种打榜暗箱操作。
于是她——开始看小说了?
不,蠢蠢欲动想要写个刷票小程序和网站的算法较量一下,看能不能被识破。
但是理智告诉她,做研究要不忘初心,总结霸总的行为规律才是首要任务,于是又回归到了霸总文本身。
开始的时候,谢与非做了个Excel表,里面列了各个网站排名前十的霸总文,并且按照简介和名字做了分类。
通过阅读大量的书评,扫文号和论坛讨论贴可知,霸总文只是一个大项目,里面还分有不同的小类与流派。
根据题材可以分为重生,穿越,现实,古代等等,穿越下面还有,等小类。
根据风格还可以分为「甜宠型」,「强迫型」,「型」,「契约情人型」等等。分析平台的榜单排名可知,目前「虐恋型」已经过时,「甜宠型」和「火葬场型」正在当红。
表列到这里,谢与非发现单纯的表格已经不能满足她了,这种复杂的分类需要一个坐标系。
于是画起了横轴和纵轴。
除了文章风格,作为霸总文灵魂的「霸总」当然也需要分类。
什么型霸总,粗暴型霸总,外冷内热型霸总,智商极高型霸总,反正也是需要一个坐标系来画明白的。
画着画着图她的思维又开始奔逸了,像霸总文这种具有高度同质性并且特徵明显的小说,是不是可以先收集大量数据建立一个语料库,然后再写一个算法让AI自动出产霸总文,只要输入想要的属性标签,然后就可以自动从语料库里摘取句子生成语段。同理可证那些打脸文丶丶文都可以一样产出。
小贴士:如果觉得不错,记得收藏网址或推荐给朋友哦~拜托啦(.)
:||
纯情女配被迫当霸总 迟迟动心 举家穿越到五零 四时不及你 第101号玩偶 御厨大人她有新派料理[美食] 瑞雪临 人间很值得 [综英美] 跟着红桶学做人 这一次,我选反派[重生] 长官,你虫设崩了[虫族] 三十七场日落 沉橘 欲拒还迎后男主精分了 花田喜事 折骨 绿茶女配的前男友们 七十年代创业忙 星际第一符籙机甲师 万人迷黑月光决定死遁
慕莲是相貌平平的十世母胎单身狗,每一世都在靠实力单身,脱单?那是不可能的事情。终于,连老天爷都看不下去了,在她第十世八十八岁生日那一天,一道骇人的闪电从天而降落在她头上从此,某蓝色星球上少了一位单身女子,而某异界突然多了一位女掌门。当慕莲站在冷风中,呼吸异界的空气时,周围突然安静了滴,您的单身系统究极进化版已上线,请查收!她不禁抽了抽嘴角,谁来告诉她,这个突然冒出来的系统到底是怎么回事...
一代战神秦九州重归都市,为弥补遗憾,搅动风起云涌,以不败之资横行四方,诸天震颤。...
...
真心换来的不是爱情,而是小三打上门,被迫净身出户。曲婉从人人羡慕的凌太太,变成一无所有的可怜虫。本以为这辈子永不再相见了,却又被命运捉弄,再次栽在凌慕白手上。我求求你,放过我好吗?偷了我的种子,还想让我放过你?...
林西楚行知是深爱不轻言小说的男女主角,由作者然非创作的现代言情小说。讲述了林西从没有想过深爱着自己的丈夫会和亲妹妹出轨,而出轨的那天,正好是她和丈夫的结婚纪念日,将林西之前所有的遐想和理想都变成了妄想,她再也忍无可忍,跟丈夫离婚之后,她就把自己的心封闭起来,任何人都进不去,突然有一天,楚行知突然闯入了她的世界。...
看了太多的主角带着剧情作弊器进入火影世界看了太多的火影同人主角有着写轮眼看了太多的主角父母双亡于是乎,本书诞生了。主角胆小怕死,只求活得滋润。主角没有写轮眼没白眼更没轮回眼。主角只有风属性的性质变化。穿越到这个世界前没有看过火影真是失败。所以,神啊,请给我一次回头的机会吧!其实是被宿友怂恿写出来的,泪目。...