0

preg_match_allのバグ?

Posted by ぞうさん@管理人 on 5月 19, 2009 in PHP な話, お知らせ

前の記事に書いた「北海道新聞 RSS」だが、今日チェックしてたらニューストップや動画トップページ(たぶん他にもありそう)のRSSで最後の2、3個記事が足りないという不具合をみつけた。

んが、ローカルのテスト環境では正常に動作するのでわたしの書いたスクリプトのバグというよりは、サーバー環境の違いのようである。
今使っているXREAのサーバーはサイトにある一覧表を見てみるとPHP 5.2.5らしく、わたしのテスト環境はPHP 5.2.4なのだが、preg_match_allの戻り値を調べてみたら違っているのがわかった。
PHPのBUG Searchも見てみたが、はっきりとこれだとわかるような記述も見当たらず。(ざっとしか見てないので見逃してるかもしれんが)

んで、抽出元のテキストのデータサイズなのかなあと考えて比較してみたが、単純にそうでもないらしい。(正常に抽出できているテキストのデータサイズより小さいテキスト(動画トップのHTML)でも戻り値がおかしい。)

ってことで、ここまで調べて行き詰まったのでいまのところ対処法なし、報告のみ。(^_^;
何か情報をお持ちの方は教えていただけると助かります。

 タグ: , ,

 
0

北海道新聞 RSS をサイトリニューアルに対応完了

Posted by ぞうさん@管理人 on 5月 19, 2009 in PHP な話, お知らせ

4月19日の北海道新聞社のサイトリニューアルに伴い、北海道新聞 RSS を修正しました。
versionが1.9.1と半端なのは、こないだ先出しでこっそりと入れ替えて様子をみていた1.9のときと、動画ニュースのページのHTMLがちょっとだけ変更されてそれの対応を追加修正したため。

変更点は、
・記事タイトルから日時の部分をカットした。(北海道新聞サイトでは当日は時間、1日経つと日付が記事タイトルに付加されているのだが、この仕様だとそのままタイトルに日時を入れているとRSSリーダーによってはデータが重複して残ってしまうのをふせぐため)
・個別のpubdateの設定をやめた。(現在の北海道新聞サイトの仕様では低コストで正確な日時の取得ができないため、どうしても記事の正確な日時が知りたい場合はリンクをクリックしてくれという結論に至る。すべてのページ(トップページや、一覧など)の記事タイトルに個別に正確な日時を埋め込んでくれれば対応可能。)
・階層があるカテゴリはそれぞれ別に指定できるようにした。(当然記事がだぶるので注意。RSSリーダーには欲しい情報だけかしこく設定してください。)
・動画ニュースのページにも対応した。(ただしPodcastのようになっているわけではなく、動画付きの記事のページタイトルのRSSというだけ。Podcastは道新が正式に提供しているものをお使いください。)
・サイトリニューアルでEnglish Newsがなくなったようだ。(RSSもエラーにした)

んで、一応5/18夜時点では正常に動作しているけど、北海道新聞サイトの大規模リニューアルなのでHTML記述が安定するまでは、また動かなくなる可能性あり。

 タグ: ,

 

Copyright © 2010 ぞうさんちv3 All rights reserved. Theme by Laptop Geek.
counter