PHP核心基础模块设计之有趣的ID生成器

在不少的技术文章，或者技术书籍中，关于唯一ID的生成，总结起来，可以有多种方法。比如：
在程序中使用全局计数器
使用数据库自增ID
相助操作系统底层或者编程语言本身提供的机制生成
使用现实世界中唯一的信息，例如个人身份证号
随机生成
根据特定的算法生成唯一序列
……
如果发散一下思维，我们还可以想到很多其他的技术实现方案。
回归到我们企业级网站系统开发，回归到业务的需求层面，到处都可以找到ID生成的业务场景，如：优惠券ID、订单流水号、新用户的UUID、工单号。那这些看似简单的ID生成，有什么要求，可以怎样实现，又有哪些隐藏的风险点呢？我们又该如何优化改进？由此带来的思考和启发是什么？
下面将一起来探讨。

1 流水号ID的约束、实现和风险点

为实际业务生成提供的流水号ID，通常需要满足两个约束：
唯一性：即生成的ID不能重复
随机性：提供的ID具备一定随机性，使得外界不能轻量穷举或遍历
这类流水号ID，会有周期性循环，例如每天都会有新的生成周期。
假设我们需要为二手商场的每次交易生成一个唯一的交易号，下面是简单的实现过程。

生成交易ID第一版

在生成ID时，有两个常用的因子，分别是：当前时间和随机数。结合当前时间和随机数，我们就能轻易构建一个随机不重复的ID。生成ID的实现函数create_trade_id()实现代码如下：

/**
 * 生成交易ID - 第一版
 *
 * 简单的ID生成
 */
function create_trade_id() {
    return date('y')
        . str_pad(date('z') % 100, 2, '0', STR_PAD_LEFT)
        . str_pad(time() % 1000, 3, '0', STR_PAD_LEFT)
        . mt_rand(100, 999);
}

根据此函数生成的交易ID，由四部分组成，从左往右依次是：
第一部分：当前年份，2 位数字表示的年份
第二部分：年份中的第几天，并对100求余数，固定2位，不足左边用0填充
第三部分：当前时间戳，并对1000求余数，固定3位，不足左边用0填充
第四部分：100到999之间的随机数，即固定3位
累加起来就可以产生一个固定长度为10位数字的交易ID。以下是几个示例：

1873295365
1873295459
1873295565

这是常见的ID生成实现方式，其中利用了时间和随机数，看起来也是能正常工作的。但实际情况真的是这样吗？它真的能由始至终提供唯一的ID吗？

生成交易ID第二版

稍加分析，就可以发现上面的create_trade_id()函数是有漏洞的，因为最后三位随机数，并不能100%保证生成的ID不会重复，只是概率相对较低。但概率低，并不表示不会发生。在完成上面业务功能需求开发并上线发布投入使用后，过了一段时间，有不少用户投诉说交易信息会错乱。经排查，正是这里生成的交易号不重复，产生了串号的情况。
针对这一故障，技术人员快速响应，立即进行了缺陷修复工作。这一次，技术人员使用了缓存，对最近已经使用的ID进行缓存并判断是否已被使用，从而修复交易串号的问题。修复后的第二版代码如下：

/**
 * 生成交易ID - 第二版
 *
 * 利用缓存，修复重复使用的缺陷
 */
 function create_trade_id_v2() {
    // 缓存实例
    $cache = new Cache();

    $newId = 0;
    do {
        $newId = date('y')
            . str_pad(date('z') % 100, 2, '0', STR_PAD_LEFT)
            . str_pad(time() % 1000, 3, '0', STR_PAD_LEFT)
            . mt_rand(100, 999);

        // 检测是否已经被使用
        if (!$cache->get('trade_id_' . $newId)) {
            break;
        }
    } while(true);

    // 标记为已使用，缓存3秒
    $cache->set('trade_id_' . $newId, 1, 3);

    return $newId;
}

这一次的实现代码，稍微有点复杂，但也还是比较容易理解的。但这样就已经是足够了吗？

生成交易ID第三版

事实上，不久后，重复交易号的问题又重现了。这是为什么呢？因为在第二版修复时，只考虑了现在，而没有考虑到过去，也没想到有未来。注意到，在交易号的第三部分，是由当前时间戳对1000求余数。这意味着什么呢？每一天，都有24小时，1440分钟，86400秒。时间戳的单位是秒，86400 / 1000的商是86，这意味着同一天内至少会有86次重复的余数。以余数为0为全例，可以算出，在同一天内余数重复的次数和时间点。

表2 同一天内余数重复的情况

序号	具体时间	同一天内的第几秒	对1000求余数	最终余数
第1次	00:00:00	0	0 % 1000	0
第2次	00:16:40	1000	1000 % 1000	0
第3次	00:33:20	2000	2000 % 1000	0
……	……	……	……	……
第84次	23:20:00	84000	84000 % 1000	0
第85次	23:36:40	85000	85000 % 1000	0
第86次	23:53:20	86000	86000 % 1000	0

序号

具体时间

同一天内的第几秒

对1000求余数

最终余数

第1次

00:00:00

0 % 1000

第2次