资讯专栏INFORMATION COLUMN

[PHP源码阅读]strpos、strstr和stripos、stristr函数

derek_334892 / 3770人阅读

摘要:例子的值是,因此核心源码调用函数查找如果不是字符串,转换成数字并赋值为该数字的字符。设置结束字符有一点要注意的是,如果不是字符串的话,会调用函数将转成整型数字并转换为其值。变量就是调用函数时传递的变量。核心源码拷贝一份调用函数找出的值。

我在github有对PHP源码更详细的注解。感兴趣的可以围观一下,给个star。PHP5.4源码注解。可以通过commit记录查看已添加的注解。

strpos
mixed strpos ( string $haystack, mixed $needle [, int $offset = 0 ] )

如果offset指定了,查找会从offset的位置开始。offset不能为负数。

返回needle第一次出现在haystack的位置。如果在haystack中找不到needle,则返回FALSE。

needle,如果needle不是字符串,它会被转换成整型数值并赋值为该数值的ASCII字符。请看下面例子。

例子
$str = "hello";
$pos = strpos($str, 111);
// 111的ASCII值是o,因此$pos = 4
strpos核心源码
if (Z_TYPE_P(needle) == IS_STRING) {
     if (!Z_STRLEN_P(needle)) {
          php_error_docref(NULL TSRMLS_CC, E_WARNING, "Empty needle");
          RETURN_FALSE;
     }

     // 调用php_memnstr函数查找needle
     found = php_memnstr(haystack + offset,
                            Z_STRVAL_P(needle),
                            Z_STRLEN_P(needle),
                            haystack + haystack_len);
     } else {
          // 如果不是字符串,转换成数字并赋值为该数字的ASCII字符。
          if (php_needle_char(needle, needle_char TSRMLS_CC) != SUCCESS) {
               RETURN_FALSE;
          }
          //设置结束字符
          needle_char[1] = 0;
          found = php_memnstr(haystack + offset,
                            needle_char,
                            1,
                            haystack + haystack_len);
    }
}

有一点要注意的是,如果needle不是字符串的话,会调用php_needle_char函数将needle转成整型数字并转换为其ASCII值。

查找函数

函数最后返回的是found,php_memnstr函数实现了查找的方法。那么再继续看看php_memnstr函数做了什么:

#define php_memnstr zend_memnstr

php_memnstr是函数zend_memnstr的宏定义,查看zend_memnstr函数如下:

static inline char *
zend_memnstr(char *haystack, char *needle, int needle_len, char *end)
{
    char *p = haystack;
    char ne = needle[needle_len-1];
    if (needle_len == 1) {
        return (char *)memchr(p, *needle, (end-p));
    }

    if (needle_len > end-haystack) {
        return NULL;
    }

    // 第一个优化,只查找end - needle_len次
    end -= needle_len;

    while (p <= end) {
        // 第二个优化,先判断字符串的开头和结尾是否一样再判断整个字符串
        if ((p = (char *)memchr(p, *needle, (end-p+1))) && ne == p[needle_len-1]) {
            if (!memcmp(needle, p, needle_len-1)) {
                return p;
            }
        }

        if (p == NULL) {
            return NULL;
        }

        p++;
    }

    return NULL;
}

第一个优化,因为(char *)memchr(p, *needle, (end-p+1)是在end - needle_len + 1(即haystack_len+1)中查找,如果p为空,说明needle的第一个字符在p中从未出现过。

strstr
string strstr ( string $haystack, mixed $needle [, bool $before_needle = false ] )

返回needle在haystack中第一次出现的位置到结束的字符串。

这个函数的区分大小写的。

如果needle在haystack中不存在,返回FALSE。

如果before_needle为true,则返回haystack中needle在haystack第一次出现的位置之前的字符串。

strstr核心源码
if (found) {
        // 计算出found的位置
        found_offset = found - haystack;
        if (part) {
            RETURN_STRINGL(haystack, found_offset, 1);
        } else {
            RETURN_STRINGL(found, haystack_len - found_offset, 1);
        }
}

strstr函数的前半部分跟strpos类似,区别在于strstr函数在找到位置后,需要返回haystack部分的字符串。part变量就是调用strstr函数时传递的before_needle变量。

stripos
mixed stripos ( string $haystack, string $needle [, int $offset = 0 ] )

不区分大小写的strpos。实现方式跟下面的类似,主要是使用一份拷贝然后将需要比较的字符串转换成小写字符后进行再进行查找。

stristr
string stristr ( string $haystack, mixed $needle [, bool $before_needle = false ] )

不区分大小写的strstr。

核心源码
// 拷贝一份haystack
haystack_dup = estrndup(haystack, haystack_len);

if (Z_TYPE_P(needle) == IS_STRING) {
    char *orig_needle;
    if (!Z_STRLEN_P(needle)) {
        php_error_docref(NULL TSRMLS_CC, E_WARNING, "Empty needle");
        efree(haystack_dup);
        RETURN_FALSE;
    }
    orig_needle = estrndup(Z_STRVAL_P(needle), Z_STRLEN_P(needle));
    // 调用php_stristr函数找出orig_needle的值。
    found = php_stristr(haystack_dup, orig_needle,    haystack_len, Z_STRLEN_P(needle));
    efree(orig_needle);
} else {
    if (php_needle_char(needle, needle_char TSRMLS_CC) != SUCCESS) {
        efree(haystack_dup);
        RETURN_FALSE;
    }
    needle_char[1] = 0;

    found = php_stristr(haystack_dup, needle_char,    haystack_len, 1);
}

if (found) {
    found_offset = found - haystack_dup;
    if (part) {
        RETVAL_STRINGL(haystack, found_offset, 1);
    } else {
        RETVAL_STRINGL(haystack + found_offset, haystack_len - found_offset, 1);
    }
} else {
    RETVAL_FALSE;
}

// 释放变量
efree(haystack_dup);

可以知道,found是从php_stristr中得到的,继续查看php_stristr函数:

PHPAPI char *php_stristr(char *s, char *t, size_t s_len, size_t t_len)
{
    php_strtolower(s, s_len);
    php_strtolower(t, t_len);
    return php_memnstr(s, t, t_len, s + s_len);
}

这个函数的功能就是将字符串都转成小写之后调用php_mennstr函数来查找needle在haystack第一次出现的位置。

总结

因为strpos/stripos返回的是位置,位置从0开始计算,所以判断查找失败都用=== FALSE更适合。

阅读PHP的源码收获挺多,一方面可以知道某个函数的具体实现原理是怎样的,另一方面可以学习到一些编程优化方案。

到此本文结束,如果还有什么疑问或者建议,可以多多交流,原创文章,文笔有限,才疏学浅,文中若有不正之处,万望告知。

如果本文对你有帮助,望点下推荐,谢谢^_^

最后再安利一下,我在github有对PHP源码更详细的注解。感兴趣的可以围观一下,给个star。PHP5.4源码注解。可以通过commit记录查看已添加的注解。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/21558.html

相关文章

  • [PHP源码阅读]trim、rtrim、ltrim函数

    摘要:系列函数是用于去除字符串中首尾的空格或其他字符。此处要注意,左右两边是一对合法的范围值,如果传递的是非法的值会报错。本文主要对函数进行分析,和函数跟的类似。更多源码文章源码阅读函数性能为王从源码剖析和源码阅读和函数源码阅读和函数 trim系列函数是用于去除字符串中首尾的空格或其他字符。ltrim函数只去除掉字符串首部的字符,rtrim函数只去除字符串尾部的字符。 我在github有对P...

    时飞 评论0 收藏0
  • Php常用函数系列之字符串处理

    摘要:规定要检查的字符串。遇到这种情况时可以使用函数进行检测。输出反引用一个引用字符串函数示例反引用一个引用字符串输出连接分割字符串使用一个字符串分割另一个字符串边界上的分隔字符。应使用运算符来测试返回值函数示例输出返回字符串的子串输入字符串。 转自我的github函数示例源码 字符串的格式化 rtrim(),除字符串右端的空白字符或其他预定义字符 ltrim(),删除字符串开头空格或...

    陆斌 评论0 收藏0
  • PHP基础知识小结

    原始数据类型(9种) 基本数据类型: 整形(integer)、浮点型(float)、字符串(string)、布尔型(boolean) 复合数据类型:数组(array)、对象(object)、callable(可调用) 特殊数据类型:资源类型(resource) 和 NULL 变量相关处理函数 is_bool($var)        判断是否为布尔型 is_int($var)    ...

    RancherLabs 评论0 收藏0
  • PHP开发手册》笔记之PHP中关于字符串的操作函数

    摘要:字符串分解操作要进行分解的字符串分解的长度。获取字符串的长度函数要进行长度计算的字符串包括首尾空格获取字符串的子串要进行截取的字符串截取开始的字符位置可选,要截取的字符串长度。默认从开始到结尾,字符串的第一个位置为获取字符串的子串 一 print和echo print 1)语法 int print(str);//str--要输出的字符串,返回值永远为1 --语法1 p...

    lingdududu 评论0 收藏0
  • PHP常用180函数总结

    摘要:输入两个数组输出返回完成后的数组在数组中根据条件取出一段值,并返回。如果要再用遍历数组,必须使用。返回值数组中当前指针位置的键值对并向前移动数组指针。键值对被返回为四个单元的数组,键名为,,和。 数学函数 1.abs(): 求绝对值 $abs = abs(-4.2); //4.2 输入: 数字 输出: 绝对值数字 2.ceil(): 进一法取整 echo ceil(9.999); /...

    HtmlCssJs 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<