カクヨムとスクレイピング
前書き
どうもなゆたです.
本記事はLOCAL学生部のAdvent Calendar 2019の15日目の記事です.
最近寒くて進捗も凍り付いております.
まぁそんなことも言ってられないので最近作ったツールの話をします.
作ったもの
カクヨムというサイトから小説のデータを保存するツールです.
カクヨムとは・・・カクヨムは、KADOKAWAが提供する小説投稿サイト。システム開発ははてなが担当している。(wikipediaより)
なぜ作ったか
オンライン上の小説は読んでいてとても面白い分いつ消えてしまうかわからないという弱点もあります.
それをどうにかしたくて保存できるようにしました.
必要なもの
- python3
- requests
インストールの仕方は調べてください.
使い方
$ python3 main.py DLしたいカクヨムのURLを入力してください https://kakuyomu.jp/works/XXXXXXXXXXXXX
このような形で実行するとkakuyomu/ というディレクトリができるのでその中を確認するとそのタイトルの小説がDLされます.
やったこと
ほぼスクレイピングしてただけです.
HTML読みながらやってました.
多分正規表現使うともう少し楽に行うことができると思います.
あとがき
オブジェクト指向プログラミングのこころを読まないといけないと痛感してきています.
あと最近Webスクレイピングばかりしているのでもう少しいい感じのことをしたいですね.
課題とテストをこなしながら趣味のWeb小説漁りをしたいです.
次のアドベントカレンダーはことみんが担当みたいです.誕生日みたいです.おめでとうございます!