YzmCMS V5.3 后台ssrf¶
一、漏洞简介¶
二、漏洞影响¶
YzmCMS V5.3
三、复现过程¶
漏洞分析¶
漏洞位于 application\collection\controller\collection_content.class.php 中的 collection_test 函数,此函数为获取一个网页中的URL,并获取此URL的值输出。类似于爬虫,爬取网页中URL对应的文章。以下为主要功能函数:
首先查看 get_content()函数:
可以看到传进来的URL不进过任何检测规则就带入 file_get_content()函数,那么倘若此 $url 为 file:// 伪协议的话,如此则产生任意文件读取漏洞。那么此时回头看 $url的值是否可控。
可以看到,$url 的值来自于 collection_node 表中的 urlpage 字段的值。如果要 $url 可控,那么就要找到一个数据库写入操作,并且urlpage 字段的值可控。再看
此函数则是将$_POST的数据写入到表中。看 insert 函数如何写。
可以看到在写入过程中经过过滤函数 safe_data() :
假设payload为:file://C:/Windows/System32/drivers/etc/hosts 可以看到此过滤函数对此payload并无任何影响,所以导致插入数据库中的urlpage字段的值可控,由此导致$url的值可控。再往下查看 get_sub_content()函数:
可以看到此函数是将 $html 中的 $start 和 $end 之间的值取出来,而 $start 表示区间开始的html表示,$end 表示区间结束的html标识。并且这两个标识不能为空。于是可以构造payload为:file://C:/Windows/System32/drivers/etc/hosts,如此进过上述函数则会取出payload并返回。再往下:
进入get_all_url()函数:
public static function get_all_url($html, $url_contain='', $url_except='') {
$html = str_replace(array("\r", "\n"), '', $html);
$html = str_replace(array("</a>", "</A>"), "</a>\n", $html);
preg_match_all('/<a ([^>]*)>([^\/a>].*)<\/a>/i', $html, $out);
$data = array();
foreach ($out[1] as $k=>$v) {
if (preg_match('/href=[\'"]?([^\'" ]*)[\'"]?/i', $v, $match_out)) {
if ($url_contain) {
if (strpos($match_out[1], $url_contain) === false) {
continue;
}
}
if ($url_except) {
if (strpos($match_out[1], $url_except) !== false) {
continue;
}
}
$url2 = $match_out[1];
$url2 = self::url_check($url2, self::$url);
$title = strip_tags($out[2][$k]);
if(empty($url2) || empty($title)) continue;
$data['url'][$k] = $url2;
$data['title'][$k] = $title;
} else {
continue;
}
}
发现其中有一个正则过滤: preg_match_all(\'/])>(\/a>.)\<\/a>/i\', $html, $out); ,此正则获取(value)括号中的值,并将其合并为一个数组。再往下看,又出现一个正则过滤:
preg_match(\'/href=[\\'\"]?(\\'\" *)[\\'\"]?/i\', $v, $match_out) ,此规则为href=\"(value)\",并获取括号中value的值给$match_out,那么此时我们的payload需更改为:
<test123><a href="file://C:/Windows/System32/drivers/etc/hosts">test</a></test123>
此时在往下看,有一个url_check函数:
可以看到会检测最后取出payload的值中是否有 :// ,巧的是我们的payload正好符合,所以该检测函数并未对payload造成影响。再往下回到最初的函数中:
至此,$articleurl 的值为我们最后的payload: file://C:/Windows/System32/drivers/etc/hosts ,直至此时,$article 的值为读取到的本地任意文件的内容,再往下看 get_filter_html()函数:
$data``[``'content'``] = self::replace_item(self::get_sub_content(``$html``, ``$config``[``'content_rule'``][0], ``$config``[``'content_rule'``][1]), ``$config``[``'content_html_rule'``]); ``return` `$data``;
由于篇幅限制,只拿出影响读取内容的代码,其实这段代码对结果并无影响,有兴趣自己下来阅读。在往下看到:
admin_tpl()函数为加载模板的函数,此模板位于:application\collection\view\collection_test.html
此处只截出影响此漏洞的代码。此处可以看到,将读取出的任意文件内容显示出来,到此则漏洞分析完毕。
漏洞复现¶
操作系统:windows 7
php版本:5.5.38 + Apache
mysql版本:5.5.53
首先登陆后台,进入 模块管理--->采集管理
添加节点
此处网站配置框中,可以在自己的vps服务器中搭建一个html网页,其内容为payload:
<test123><a href="file://C:/Windows/System32/drivers/etc/hosts">123</a></test123>
获取网站中的区域开始html为,区域结束的HTML为。点击保存。
再次点击测试采集,则读取payload中的hosts文件。
复现成功。