正文段落一

正文段落二,需要足够长的文字才能通过提取阈值校验。
',
'https://news.sjtu.edu.cn/jdyw/20260408/221279.html'
);
$this->assertStringContainsString('https://news.sjtu.edu.cn/resource/upload/a.png', $normalized);
}
public function test_extracts_pedata_article_main(): void
{
$html = <<<'HTML'
清科研究中心正文段落一,包含足够长的文字用于通过正文提取阈值校验。
第二段正文内容继续补充长度,确保 strip_tags 后超过三十个字符。