资讯专栏INFORMATION COLUMN

swoole+Mixphp+CodeIgniter开发失踪儿童信息平台

jasperyang / 1063人阅读

摘要:写基于和开发的失踪儿童信息平台。团圆系统的全称应该是公安部儿童失踪信息紧急发布平台,在新浪微博上有一个官方的微博账号,通过这个微博账号发布儿童失踪信息。

这是我在sf上的第一篇文章。写基于swoole、Mixphp和CodeIgniter开发的失踪儿童信息平台。

在2017年的时候,关注到有一个“团圆系统”,它是公安部专门为了快速扩散失踪儿童消息的平台,但是网上并没有找到这个平台的地址。当然,偶然在淘宝平台上找到一个接口,这个接口可以取得失踪儿童的数据,后来这个接口提示不能访问了。那么如果我想去做这样的一个失踪儿童信息平台的话,就要从另外的地方获取数据了。

团圆系统的全称应该是公安部儿童失踪信息紧急发布平台,在新浪微博上有一个官方的微博账号,通过这个微博账号发布儿童失踪信息。因此在实现“失踪儿童信息平台”的第一步就是从微博上去获取数据,并且这个获取数据的程序最后能在后台程序自动运行,这样就不用人工干预了。

从微博页面抓取数据

我对php语言要熟悉一些,因此在打算自己动手实现这个想法的时候,就选择了php,另外之前也关注到swoole,swoole拓展了PHPer的能力范围,不再局限于Web开发。进而找了一个比较容易上手的基于swoole的框架MixPHP,因此,在从微博上抓取数据的程序是基于Mixphp写的,工程结构如下:

在apps/daemon/commands目录下新建一个控制器IndexController.php,控制器部分代码如下:

processName}" is running, PID : {$pid}." . PHP_EOL;
        }
        // 启动提示
        echo "mix-daemon "{$this->processName}" start successed." . PHP_EOL;
        // 蜕变为守护进程
        if ($this->d) {
            Process::daemon();
        }
        // 写入 PID 文件
        Process::writePid(self::PID_FILE);
        // 修改进程名称
        Process::setName("mix-daemon: {$this->processName}");
        // 开始工作
        $this->startWork();
    }
    public function startWork()
    {
        try {
            while (true) {

                //实时采集一次
                $sql = "select `itemid` from items where status=:status";
                $rows = mix::app()->rdb->createCommand($sql)->bindParams([
                    "status" => "失踪"
                ])->queryAll();
                if (!empty($rows)) {
                    foreach ($rows as $row) {
                        //采集一次失踪的,
                        $this->actionDetail($row["itemid"]);
                        sleep(5);
                        //再增量采集一次
                        $this->actionIncrementOnce();
                    }
                }
            }
        } catch (Exception $e) {
            Mix::app()->error->exception($e);
            sleep(10); // 休息一会,避免 cpu 出现 100%
            $this->startWork();
        }
    }
    }

哦,需要提醒的是,Mixphp需要一些准备条件,在官方文档中写的非常详细。安装好Mixphp之后就可以直接运行上面的后台程序,命令如:

./mix-daemon index/start -d

-d 表示这个进程将在后台运行。
数据的抓取分为几个部分,

批量抓取,在程序第一次运行时会给定一些url进行批量初始化抓取

增量抓取,会根据抓取回来的页面内容分析新的url,再进行抓取新的url

补充抓取,意思是部分儿童的状态为失踪,隔一段时间之后找回来了,那么状态也会发生变化,因此要对这些url进行补充抓取。

前台展示页面

前台展示,相当于做一个网站,使用的是CodeIgniter框架,这个框架用来做网站,很方便,因此我也一直在用。
整个网站只显示那些仍然处于失踪状态的儿童的信息。页面的效果大致是这样的:

另外一个就是发微博

我在微博开发平台注册了一个应用,可以调用微博的api,因此在数据抓取的程序里,在数据存到数据库中的同时会发一条微博。调用的是share接口。使用微博的api的过程是这样的,先使用oauth获取到access_token,另外从微博开发平台找到key和secret,部分代码如下:

$c = new SaeTClientV2(WB_AKEY, WB_SKEY, $access_token);
$sus = mix::app()->rdb->insert("items", $dataArray)->execute();
$insertId = Mix::app()->rdb->getLastInsertId();
$affectedRowss = Mix::app()->rdb->getRowCount();
if ($affectedRowss > 0) {
    $texts = "" . $dataArray["name"] . "," . $dataArray["agesex"] . "," . mb_substr($dataArray["detail"], 0, 110, "utf-8") . "..." . "如有线索,请迅速与警方联系:" . $dataArray["policetel"] . "http://www.anman.org/index/baobei/" . $containerid;
    if ($weibopic) {
        $weibopic = $this->get_img($weibopic, mix::app()->getRuntimePath());
    }
    $weiboRep = $c->share($texts, $weibopic);
    if (isset($weiboRep["id"])){
        $sinaweibos = array("itemid"=>$containerid,"weiboid"=>$weiboRep["id"]);
        mix::app()->rdb->insert("sinaweibos",$sinaweibos)->execute();
    }
    if ($weibopic){
        unlink($weibopic);
    }
    echo date("Y-m-d H:i:s") . " " . $containerid . "微博发送成功!" . PHP_EOL;
    echo date("Y-m-d H:i:s") . " " . $containerid . "插入数据操作成功" . PHP_EOL;
    mix::app()->log->info(date("Y-m-d H:i:s") . " " . $containerid . "插入数据操作成功");
} else {
    mix::app()->log->error(date("Y-m-d H:i:s") . " " . $containerid . "插入操作出错");
}

微博的效果如下:

总结一下:

整个实现过程中使用到了swoole,codeigniter框架,微博开发平台,mysql。
后台程序从微博中抓取数据到本地,然后根据规则通过微博api在发送微博。
有一个专门的网站去展示这些信息。
后面我打算试着去对这些数据做一些分析。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/28677.html

相关文章

  • 我为什么要开发一个 MixPHP 框架

    摘要:异步队列消费者开发只提供了模式下运行控制器方法,并未提供主进程多子进程的进程模型,并未提供多线程处理。多线程异步队列服务只需写好控制器方法,然后在配置文件中配置下路由命名空间进程线程数量,就可在模式中启动多进程多线程模型的异步队列处理程序。 最近业余时间一直在开发ExpressPHP的第二个版本 MixPHP,今天下班想起之前一个面试官的问题:你为什么还要再造一个轮子呢?仔细回想,第一...

    SnaiLiu 评论0 收藏0
  • MixPHP/Yii/CodeIgniter 并发压力测试

    摘要:由于是基于的传统框架,如果使用的正常部署方式来对比,显得有些不公平,由于同时支持在中运行,所以此次测试的是部署在之中。你也来测试一下吧, MixPHP 是一个基于 Swoole 的高性能框架,CodeIgniter 是一个元老级的轻量级框架,Yii 是一个非常流行的框架,以下是三个框架的对比。 由于 Yii/CodeIgniter 是基于 Apache/PHP-FPM 的传统框架,如果...

    ashe 评论0 收藏0
  • MixPHP:基于 Swoole 的常驻内存型 PHP 框架

    摘要:框架最新源代码行数行,因此可以很容易的改造它,成为你们公司的专属框架。也不同于其他基于的微服务框架,只聚焦于微服务治理,定位于开发的更多领域,覆盖从初创到亿元级体量的技术诉求。的授权全靠用户自愿购买,详情 MixPHP是什么 MixPHP 是秉承 普及 PHP 常驻内存型解决方案,促进 PHP 往更后端发展 的理念而创造,采用 Swoole 扩展作为底层引擎,围绕常驻内存的方式而设计,...

    王晗 评论0 收藏0
  • MixPHP 环境搭建之 Apache + PHP

    摘要:在多种环境中迁移,代码无需修改,是无缝迁移的。由于大部分用户开发是在中进行,因此开发阶段我们推荐使用部署方案,因为更简单快速,下面整体演示一下的环境搭建。安装解压至指定安装目录。先不要启动,这会启动会报错,没加环境变量。 MixPHP 是一款基于 Swoole 的常驻内存型 PHP 高性能框架。 MixPHP 同时支持多种环境中执行: Nginx + mix-httpd (使用到 S...

    Barrior 评论0 收藏0
  • MixPHP 环境搭建之 Apache + PHP

    摘要:在多种环境中迁移,代码无需修改,是无缝迁移的。由于大部分用户开发是在中进行,因此开发阶段我们推荐使用部署方案,因为更简单快速,下面整体演示一下的环境搭建。安装解压至指定安装目录。先不要启动,这会启动会报错,没加环境变量。 MixPHP 是一款基于 Swoole 的常驻内存型 PHP 高性能框架。 MixPHP 同时支持多种环境中执行: Nginx + mix-httpd (使用到 S...

    microelec 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<