gcf (gcores fans) 是一个私自发布在PyPI上的命令行工具,由长期无法参加核聚变所导致的愤懑和嫉妒汇聚而成。本文是以一种“狂给自己加戏”的态度写成的ReadMe。
gcf 使用 pandas 这把屠龙刀对抓取到的机核电台节目信息进行简单的检索和统计,包括各期节目的名称,栏目,编号,DJ群,上线日期,url 等。搜索功能十分粗陋,编写动机十分可鄙。如果阅读时产生不适感,或对gcf有任何问题请查阅 PyPI 的工程说明或在github上提issue。
西蒙的出台率是多少?
到底机核哪个DJ才是四十二的心头好?
macOS用户:请打开终端Terminal,用 'pip install gcf' 进行安装。pip是一个Python包管理器,如果你的mac没有pip,请使用'sudo easy_install pip'进行安装或搜索 “mac安装pip” 。
windows用户:请打开cmd,用'python pip install gcf' 进行安装。如果你的windows没有Pyhton,请先安装python2.7。
在macOS的Terminal中直接运行'gcf' ,或者在Windows的cmd中运行'python gcf'可以直接查看简单的参数说明:
由于原始数据集只包含2018年6月以前的电台节目,因此安装完毕后,需要对 gcf 的原始数据集进行更新:
$ gcf update
卸载 gcf 只需要运行 'pip uninstall gcf' 即可。
数据集更新后,用一个基本搜索来说明 gcf 的用法及部分参数的意义:
$ gcf --dj '西蒙' --title '史' --prog 'GADIO pro' --time 20170201 20180405
gcf 命令的参数通常包含参数名和参数值,参数名 --dj 标定主持人,--title 标定标题中的关键字,--prog 标定栏目名称,--time 标定时间段。除时间参数外,注意其他几个参数需要用英文单引号括住。上文的搜索包含了4个搜索条件,其中任意搜索条件都可以单独进行搜索,被去掉的任何条件参数都会扩大对该参数的搜索,比如去掉时间参数 --time 20170201 20180504,搜索结果就会扩大到任意时间,而不只是指定时间段。
如果想要搜索 DJ 组合,而不是单个 DJ,可以用 '#' 将多个 DJ 的 id 连起来作为 --dj 的参数值进行搜索:
$ gcf --dj '四十二#麦教授'
搜索DJ时,用 '#' 可以得到多个DJ的交集,而在搜索标题 --title 时,用 '#' 则会得到多个关键字的并集。
gcf 的基本搜索还可以指定列内容,比如增加各期节目的index和网页链接,例如老白参加的所有节目可以这样搜索:
$ gcf --dj '白广大' --col 'title#index#url'
通过对主持人,标题等参数的选定,得到各种基本搜索的结果后,gcf 的子命令 career 和 statistic,可以对基本搜索的结果进行处理。
career 是 gcf 提供的生涯模式,可以用基本搜索得到龙马参与过的所有电台节目,并用生涯模式进行解读:
$ gcf --dj 'Ryoma' career --size Q --ratio 0.5
需要注意的是,子命令不是参数,因此 career 没有 ‘-’ 这个符号
每行的行首为日期-季度和出台次数,图表展示了龙马(Ryoma)自2010年以来每个季度出台数的起伏变化。gcf 首先搜索了龙马参加过的所有节目,然后将结果传给子命令 career 进行统计。career 的参数 --size 标定了统计的时间粒度为季度 Q,还可以按照年度 Y,以及月度 M 来统计。--ratio 标定了图表的收缩系数,即图表的宽度,数字越小,宽度越大。选择合理的收缩系数可以防止过大或过小的统计数字影响图表显示效果。
生涯模式中还可以标注 --perc,标注后 gcf 会将出台次数与当时段总节目数相比,转化为出台率,例如:
$ gcf --dj '四十二' career --size Q --ratio 0.5 --perc
在各季度统计的行尾,可以看到当季电台节目总数及四十二的出台率,本季度达到破纪录的56%,也是出台次数最多的季度之一,鉴于本季度于6月底才结束,而本文只统计至6月中旬,因此这一记录还有望刷新!
gcf 提供的统计模式 statistic 可以对基本搜索结果的栏目和 DJ 进行统合。比如:
$ gcf --dj '四十二' --recent 100 statistic
如果去掉参数 --recent 100,则查询范围扩大到往期所有电台节目,而不只是有四十二参加的“最近100期”。从图表中可以看到四十二最近参加的100期中各栏目次数,以及最常搭档的DJ排名,因此荣获本届《四十二百期心头好》大奖的前三名 DJ 分别是:
Ryoma(龙马) - 55次
Nadya - 48次
xizongbu(西总布) - 35次。
谁最常参加关于任天堂的节目?
网站上有多少期节目没有标注主持人?都是哪几期?
新闻节目里谁只出现过1次?
如何吐出基本数据集中的所有节目?
谁最常参加关于任天堂的节目?
无法准确搜索,因“关于任天堂”这一词语无法确切界定范围,大致搜索为:gcf --title '任天堂#老任#Nintendo#Switch#NS' statistic
网站上有多少期节目没有标注主持人?都是哪几期?gcf --dj 'NULL'
新闻节目里只出现过1次的DJ是谁?gcf --prog 'GADIO News' statistic
如何吐出基本数据集中的所有节目?
gcf -d ''
必须说明,由于 gcf 目前处于0.0.3dev的开发阶段,因此可能出现各种问题:
评论区
共 98 条评论热门最新