地元に戻ってからやろうとして諦めたことリスト(プログラム的な意味で)

地元の群馬県にありまする吾妻郡東吾妻町に戻ってきてから、「あれをやろう、これをやろう」と思えど、結局やらず終いなことをまとめてみようと思います。

#1 東吾妻町Webサイトの新着情報RSS化

戻ってすぐに地元情報を効率よく収集しようと考え、町のWebサイトのRSSをGoogle Reader(RSSリーダ)で読み込めれば素敵!!ということで、
「1日1回スクレイピングしてDBに入れ込んで最新10件くらい吐き出す」程度の仕様で考えていました。言語的にはRubyでnokogiriを使って該当箇所を取得してソートして云々程度で作れるなー、簡単だなーと思っていました。

しかし、いざ実装しようとしたところ、想像の斜め上をいく問題が発覚し、どうにもならないなぁ〜といった塩梅で諦めてしまいました。

その問題というのが、そもそもこのサイトの新着情報って何だろうか?

Topページを確認すると、この辺りが対象なのかな?と思います。

  • 動的に更新されてはいないと思われる「新着情報」
  • パンくずリストを辿ると新着情報とは別に存在するらしい「お知らせ」
  • 区分けの方法がよくわからない「トピックス」

入札情報がどこかに載りそうなものですが、それもないので、機能としては新着は存在していないようなものだと思いました。

また、nokogiriでのスクレイピングを考えた際に、CSSがインラインでHTMLに書きこまれていてidもほとんど見当たらないので、そのままお手上げ〜のまま終了。

#2 中之条町総合案内の新着RSS化

隣町の情報ならいけるかな?と思って検討してみましたが、最終的に面倒になりました。

こちらのWebサイトでは、「新着情報」がしっかりと明記されていますが、そのすぐ下に「注目情報」の欄があり、これは一体どちらがどっち?と思いましたが、恐らく両者の情報を合わせたものが全体の最新情報の形式になるだろう、と思ったところまでは良かった。

idがいない、そしてテーブルレイアウトだ。

ゴニョゴニョすればできそうなものですが、面倒臭さと利益を天秤にかけて中止。

#3 Twitterで地元関連情報を収集してまとめるシステム

情報を垂れ流すだけのbotを破壊したい

時に、アニメ「日常」に中之条くんというキャラクターがいるらしく、そのbotが非常に面倒で。ブラックリストを作成しデータ収集時にアレコレするかと思うところまで行きましたが、Twitterの検索結果をRSSで収集して目grepで重要情報確認すればイケル、ということで不要なので中止しました。

(そもそも、幾つかのキーワードに於いて言及数が非常に少ないので目grepでいけた)

まとめ

情報格差というか、そもそも情報を活用するという文化がないようなので、どうにかしていきたいですね…どうにか…うん。

コメントを残す

メールアドレスが公開されることはありません。