*

PHP Simple HTML DOM Parserでplaintextにタグが残る

投稿日:2015/01/17 最終更新日:2015/01/17

PHP Simple HTML DOM Parser でちょっと遊んでいる。

あるサイトの更新情報を引っ張ったりなどしていたが、plaintext にimgの閉じタグが残ってしまう現象が起きた。

確実に忘れそうなのでメモしておく。

 

現象

対象から引っ張ってきたものがこれ。
これを $hoge に突っ込んでる体にする。

<a href="相対パス" ><img src="NEW画像相対パス"></img>テキスト</a>

 

例えばタグを抜いてテキストだけ表示しようとする。

echo $hoge->plaintext;

 

表示結果

</img>テキスト

 

解決

strip_tags関数でタグを抜いてやる。

$text = strip_tags($hoge->plaintext);

 

</img>タグ自体あまり目にしないからレアケースなのかな?
ともかくこれで問題なく動作した。

 

PHP/クローラ周りのオススメ本

  • このエントリーをはてなブックマークに追加
  • Pocket
  • 1 follow us in feedly

関連記事

no image

WordPressでメニューが文字化けする

WordPressでメニューを編集した際、保存を押すと文字化けが起きた...

記事を読む

新着記事

no image

【WordPress】WP Super Cacheで設定時に500エラーが出るときの対処法

WordPressのページキャッシュ用にWP Super Cacheと...

記事を読む

【Debian】mysqlのスロークエリログを取得する手順

VPSにWordPressをインストールしていると、キャッシュプラグイ...

記事を読む

no image

MIFES10でUWSCの予約語・キーワードを明示する

最近エディタにはMIFES10を利用しているが、UWSCの利用頻度が上...

記事を読む

no image

WordPressでメニューが文字化けする

WordPressでメニューを編集した際、保存を押すと文字化けが起きた...

記事を読む

no image

WEBサイトキャプチャーツール「CrenaHtml2jpg」が便利

WEBサイトのキャプチャを作成したい事は多々ある。 これまでは He...

記事を読む

コメント/トラックバック

トラックバック用URL:

この投稿のコメント・トラックバックRSS




管理人にのみ公開されます

no image
【WordPress】WP Super Cacheで設定時に500エラーが出るときの対処法

WordPressのページキャッシュ用にWP Super Cacheと...

【Debian】mysqlのスロークエリログを取得する手順

VPSにWordPressをインストールしていると、キャッシュプラグイ...

no image
MIFES10でUWSCの予約語・キーワードを明示する

最近エディタにはMIFES10を利用しているが、UWSCの利用頻度が上...

no image
WordPressでメニューが文字化けする

WordPressでメニューを編集した際、保存を押すと文字化けが起きた...

no image
WEBサイトキャプチャーツール「CrenaHtml2jpg」が便利

WEBサイトのキャプチャを作成したい事は多々ある。 これまでは He...

→もっと見る

PAGE TOP ↑