この記事はブロックされています。続きを読みたい方はログインをして下さい。会員ではない方は新規会員登録をして下さい。


塾生の皆様、新年明けましておめでとうございます

塾生の皆様、新年明けましておめでとうございます。

新年明けましておめでとうございます
新年明けましておめでとうございます

2014年は消費税も上がり、なにかと世間が騒がしくなりそうな予感がしますよね。
塾長は正月の間、ずっと開発を続けておりました。2014年の前半はこんなことをやります。

まず大好評だったオートブログの続編オートブログ講座2をやります。これが目玉です。
今とりあえずワードプレスを使い記事を増やし、検索エンジンにインデックスされアクセス数も増えてきたかと思いますが、やはり問題がいくつかある。

まずなんといってもサーバーの耐久力ですね。ロリポップでもさくらでもエックスサーバーであっても、ある程度の負荷までは速いのだが、そこから閾値を超えた負荷が掛かるとレンタルサーバーなのでリミットが掛かる。
なので通常の使い方をしていればそれほど差はないのだが、記事が数万件レベルに達するとどこのサーバーを使おうが遅くなる。

そうなると自前のサーバーをサーバー屋に持ち込んでハウジングという形になるわけだが、ハウジング料と回線使用料で月々数万円掛かるので、おそらくは維持費を回収するのが難しくなる。独自のウェブサービスを立ち上げたい場合はいいと思うが、たかがブログに高いサーバー代を払っていると広告収入がいくらあっても足りなくなる。

調べてみて分かったことなのだが他にも問題がある。Google Analyticsでは分からないのだが、ページ数がたくさんあるとボットプログラムが多数やってくる。Googleもボットを派遣してデータを解析しているわけだが、よく分からないボットがきてもメリットはない。ただ負荷が増大するだけだ。
Google Analyticsは恐らくはボットは統計には入れていないので認識できない。

2013年12月13日の記事だが「今やウェブ訪問者の61.5%は「」」というニュースがあった。

▼今やウェブ訪問者の61.5%は「ボット」(Incapsula調べ)
http://news.livedoor.com/article/detail/8343650/

ボットといってもウイルスに感染したPCが操られて脆弱性のあるサイトを調査しているのがほとんどという話だが、いずれにせよサーバーが遅くなることには変わりがない。

そこで、オートブログ講座2ではある条件を満たさない記事は自動的に削除する機能をワードプレスに仕込む方法を勉強する。
例えば、記事にカウンタを付けて一定期間内に閲覧数がまったくないとか、閲覧はされたけれど最近では閲覧されていないといった記事を見つけてリストラすることができる。
これで人気記事だけがブログに残ることになり、ワードプレスの負荷もかなり減る。

さらにRSSに頼らない記事取得にもチャレンジする。自分が集めたい情報がRSSとして提供されていない、あるいはあっても商業的には利用できなかった、という人もいると思う。そこで、RSSに頼らずにネットから情報を集めてブログを自動構築する方法にチャレンジする。
最近流行りの文章要約(サマリー)技術だが、これを使ってまとめサイトを作ってみる。
考え方としては以下の通りだ。

関連記事