> プラグイン > DomCrawlerでの日本語含む領域の取り方について |
プラグイン
スレッド表示 | 新しいものから | 前のトピック | 次のトピック | 下へ |
投稿者 | スレッド |
---|---|
ikemoto |
投稿日時: 2016/5/30 7:10
対応状況: −−−
|
一人前 登録日: 2015/10/2 居住地: 投稿: 79 |
DomCrawlerでの日本語含む領域の取り方について お世話になります。
現在プラグインで、特定の条件下において商品登録画面の規格登録ボタンを表示しないように設定しようとしています。 DomCrawlerを使用して該当領域を取得出来たのですが、削除が出来ません。 $sourceに商品登録画面のhtmlを格納した状態で… $crawler = new Crawler($source); $remove_target = $crawler->filter('#common_button_box__class_set_button'); $source = str_replace($remove_target,'',$source); …としましたが、 $remove_targetで取得された中で、 「規格設定」と書かれた日本語部分が文字化けしていて str_replace処理の中で空白置換の対象が無い、となっているようです。 DomCrawlerでの処理の際、日本語を含む箇所を取得する際に文字化けさせないようにするにはどうしたら良いでしょうか? |
ikemoto |
投稿日時: 2016/5/30 7:34
対応状況: −−−
|
一人前 登録日: 2015/10/2 居住地: 投稿: 79 |
Re: DomCrawlerでの日本語含む領域の取り方について すみません、自己解決しました。
DomCrawler スクレイピング 文字化け で検索したら解法説明がありました。 日本語含む領域を文字化けさせずに取得するのは、 $crawler = new Crawler($source); を、 $crawler = new Crawler(); $crawler->addHtmlContent($source, 'utf-8'); にすれば良いってことでした…。 (以前この掲示板で、文字化け見つけた報告者側としてこの辺のやりとりしたことあったのですが、すっかり忘れていました…)。 |
スレッド表示 | 新しいものから | 前のトピック | 次のトピック | トップ |