无聊开个坑……为了学弟的数论提前做好准备。
本文的写作目的是在你只接触过一点数论的情况下教会你莫比乌斯反演和杜教筛……
顺便加深一下我的理解。

下文规定，\([P]\) 表示，若 \(P\) 成立，\([P]=1\)，否则 \([P]=0\)。

数论分块

之所以要放到这里讲，是因为……不知道。

数论分块可以在 \(O(\sqrt n)\) 的复杂度内计算 \(\sum\limits_{i=1}^n f(i)g(\lfloor\frac ni\rfloor)\) 的值，但前提是可以求出 \(f(i)\) 的前缀和并算出所有 \(g(\lfloor\frac ni\rfloor)\,(1\le i\le n)\)。
简单地说，就是，打表可以发现，\(\lfloor\frac ni\rfloor\) 有很多连续的相同段，故可以用乘法分配律把相同的段放在一起算，那么复杂度应该就是段数。

然后有一个结论，\(\lfloor\frac ni\rfloor\,(1\le i\le n)\) 的取值只有 \(O(\sqrt n)\) 种（\(2\sqrt n\) 种左右）。
证明：
分类讨论。
若 \(i \le \sqrt n\)，则此时的 \(i\) 只有 \(O(\sqrt n)\) 种，\(\lfloor\frac ni\rfloor\) 自然也只有 \(O(\sqrt n)\) 种。
若 \(i > \sqrt n\)，则易得 \(\frac ni < \sqrt n\)，此时 \(\lfloor\frac ni\rfloor\) 也只有 \(O(\sqrt n)\) 种。
故结论成立。

于是，如果要实现程序，需要知道每一段的最右端，即在给定 \(i\) 的情况下求得满足 \(\lfloor\frac ni\rfloor = \lfloor\frac nx\rfloor\) 的最大的正整数 \(x\)。
又一个结论：\(x = \lfloor\frac n{\lfloor\frac ni\rfloor}\rfloor\)。
证明：
由于 \(\lfloor\frac ni\rfloor = \lfloor\frac nx\rfloor\)，故 \(\lfloor\frac ni\rfloor \le \frac nx < \lfloor\frac ni\rfloor+1\)。
故有 \(\frac n{\lfloor\frac ni\rfloor+1} < x \le \frac n{\lfloor\frac ni\rfloor}\)。
要 \(x\) 最大，即为 \(\left\lfloor \frac n{\lfloor\frac ni\rfloor}\right\rfloor\)。
证毕。

参考代码

for(int l = 1,r;l <= n;l = r + 1)
{
    r = n / (n / l);
    //do sth with [l,r]...
}

筛法

埃氏筛

埃氏筛的起源是，首先假设 \([2,n]\) 以内的整数都是质数，然后对于每个数，枚举其除了自身以外的倍数，并把其标记为合数。
最后得到的就是质数了。

然而这样子非常的慢……
根据调和级数，复杂度是 \(O\left(\sum\limits_{i=1}^n \frac ni\right) = O(n \log n)\)。

于是，埃氏筛就出现了：只枚举素数的倍数。
这个比较显然，对于合数 \(i\)，其倍数 \(d\)，也是 \(i\) 的因数的倍数，故合数的倍数均已经被筛过。

以上就是埃氏筛的主要思想，但是实际实现的时候，我们一般枚举 \(i\) 的倍数的时候，会从 \(i^2\) 开始筛，因为其以下的倍数都已经被筛过了。

时间复杂度

埃氏筛的复杂度为 \(O(n \log \log n)\)。

证明如下（可以跳过）：
第 \(i\) 个素数可以近似地表示为 \(i \ln i\)。
而 \(\pi(n)\)（\(n\) 以内的素数个数）也可以近似地表示为 \(\frac n{\ln n}\)。
故算法的复杂度为 \[O\left(\sum\limits_{i=2}^{\left\lfloor\frac n{\ln n}\right\rfloor} \frac n{i \ln i}\right) = O\left(\int_2^{\frac n{\ln n}} \frac n{x \ln x}\text{d}x\right) = O(n \ln \ln n) = O(n \log \log n)\] 实际上这个复杂度并没有考虑到从平方开始枚举倍数的优化。

欧拉筛 / 线性筛

从名字就能看出来这个算法是线性的。

注意到埃氏筛优化之后仍然会有重复筛到的数。
于是欧拉筛的思想就是：令每个数被其最小质因子筛到。
这样就有了代码实现的问题。

于是，我们原来是枚举质数 \(i\)，然后枚举其倍数 \(ij\,(1 \le j \le \frac ni)\)。
现在我们换个顺序，先枚举这个 \(j\)，然后再枚举一个质数 \(i\,(1 \le i \le \frac ni)\)。

那么，令 \(j\) 的最小质因子为 \(p\)，则对于 \(i \le p\)，\(i\) 显然都是 \(ij\) 的最小质因子。
而对于 \(i > p\)，则 \(ij\) 的最小质因子为 \(p\)，故此时可以退出。

参考代码

#include <cstdio>
const int N = 1e7;
int n;
int vis[N + 5],cnt,prime[N + 5];
int main()
{
    scanf("%d",&n);
    for(int i = 2;i <= n;++i)
    {
        if(!vis[i])
            prime[++cnt] = i;
        for(int j = 1;j <= cnt && i * prime[j] <= n;++j)
        {
            vis[i * prime[j]] = 1;
            if(i % prime[j] == 0)
                break;
        }
    }
    for(int i = 1;i <= cnt;++i)
        printf("%d ",prime[i]);
}

上述代码输出了给定的正整数 \(n\) 以内的所有质数，其中 \(n \le 10^7\)。

时间复杂度

从代码似乎不能明显地看出复杂度，然而根据其思想，容易得到其复杂度为 \(O(n)\)。

数论函数

定义

数论函数指定义域为正整数，值域为复数的函数。
在一些文献里也叫做算术函数。

积性函数

本来还有个加性函数，这里略过。

对于一个数论函数 \(f\)，若对于所有 \(\gcd(x,y)=1\) 都有 \(f(xy) = f(x)f(y)\) 成立，则称 \(f\) 是一个积性函数。
特别地，若 \(f\) 对于所有 \(x,y\) 都满足上式，则称 \(f\) 为完全积性函数。

易知积性函数 \(f\) 一定满足 \(f(1) = 1\)。

常见的积性函数有：

元函数：\(\epsilon(n) = [n = 1]\)
单位函数：\(\textbf 1(n) = 1\)。
标号函数：\(\textbf{ID}(n) = n\)。
约数函数：\(\sigma_k(n) = \sum\limits_{d \mid n} d^k\)。
欧拉函数：\(\varphi(n) = \sum\limits_{i=1}^n [\gcd(i,n)=1]\)。
莫比乌斯函数：\(\mu(n) = \begin{cases}1,&n=1\\0,&\exists_{d>1}\ d^2 \mathop{ \mid } n\\(-1)^{\omega(n)},&\forall_{d>1}\ d^2 \not\mathop{ \mid } n\end{cases}\)，其中 \(\omega(n)\) 表示 \(n\) 的不同质因子个数。
刘维尔函数：\(\lambda(n) = \prod\limits_{i=1}^m(-1)^{c_i}\)，其中 \(n=\prod\limits_{i=1}^mp_i^{c_i}\)。

（比较显然的）性质

若 \(f,g\) 为积性函数，则：

\(h(x) = f(x^C)\)
\(h(x) = f^C(x)\)
\(h(x) = f(x)g(x)\)
\(h(x) = \sum\limits_{d \mid x} f(x)g(\frac xd)\)

都是积性函数。

欧拉函数

定义：\(\varphi(n) = \sum\limits_{i=1}^n[\gcd(i,n)=1]\)。

通式

对于 \(n > 1\)，令 \(n = \prod\limits_{i=1}^m p_i^{c_i}\)，其中 \(p_i\) 为互不相同的质数（即分解质因数）。
则 \(\varphi(n) = n \prod\limits_{i=1}^m (1 - \frac 1{p_i})\)。

证明：考虑容斥。
首先假设前 \(n\) 个正整数都与 \(n\) 互质，然后从中减去 \(p_1\) 的倍数，\(p_2\) 的倍数……\(p_m\) 的倍数。
但是这样会重复减 \(p_1,p_2\) 的公倍数，\(p_1,p_3\) 的公倍数……\(p_{m-1},p_m\) 的公倍数，于是再加回来。
然而又会重复加 \(p_1,p_2,p_3\) 的公倍数，\(p_1,p_2,p_4\) 的公倍数……\(p_{m-2},p_{m-1},p_m\) 的公倍数，于是再减去。
……

注意到前 \(n\) 个正整数中 \(i\) 的倍数的个数为 \(\lfloor\frac ni\rfloor\)，而以上的 \(i\) 都为 \(n\) 的因子，取整符号可去掉。
故 \[\varphi(n) = n - \frac n{p_1} - \frac n{p_2} - \dots - \frac n{p_m} + \frac n{p_1p_2} + \frac n{p_1p_3} + \dots + \frac n{p_{m-1}p_m} - \frac n{p_1p_2p_3} - \frac n{p_1p_2p_4} - \dots - \frac n{p_{m-2}p_{m-1}p_m}\]

然后，就是欧拉函数通式推导的神奇的一步。
注意到每一项的符号取决于分母是多少个质因子的乘积，故可以视作是若干个 \(-\frac 1{p_i}\) 的乘积乘 \(n\) 的结果。
故 \[\varphi(n) = n\prod\limits_{i=1}^m\left(1 - \frac1{p_i}\right)\]

由上式易得欧拉函数为积性函数。

性质及证明

欧拉定理

若 \(\gcd(a,n) = 1\)，则有 \[a^{\varphi(n)} \equiv 1 \pmod n\]

严谨的证明要牵扯到各种剩余系之类的名词，这里用一种比较通俗的说法代替。
证明：
令 \(x_1,x_2,\dots,x_{\varphi(n)}\) 为前 \(n\) 个正整数中与 \(n\) 互质的 \(\varphi(n)\) 个数。
再令 \(y_i = a \cdot x_i\)。

这里要先证明两个性质：

\(y_i \not\equiv y_j \pmod n\,(i \ne j)\)。
反证法。假设存在 \(y_i \equiv y_j \pmod n\)。
则根据同余式的性质与 \(\gcd(a,n) = 1\)，有 \(x_i - x_j \equiv 0 \pmod n\)。
但由于 \(1 \le x_i < n\)，易知假设不成立。
\(\gcd(y_i \bmod n,n) = 1\)。
由于 \(y_i = a \cdot x_i\)，又因为 \(\gcd(a,n) = \gcd(x_i,n) = 1\)，又根据欧几里得算法，原式显然成立。

根据上述两个性质可得 \[ \begin{align*} \prod\limits_{i=1}^{\varphi(n)} y_i & \equiv \prod\limits_{i=1}^{\varphi(n)} x_i \pmod n \\ \prod\limits_{i=1}^{\varphi(n)} a\cdot x_i & \equiv \prod\limits_{i=1}^{\varphi(n)} x_i \pmod n \\ a^{\varphi(n)} \prod\limits_{i=1}^{\varphi(n)} x_i & \equiv \prod\limits_{i=1}^{\varphi(n)} x_i \pmod n \\ a^{\varphi(n)} & \equiv 1 \pmod n \end{align*} \]

证毕。

当 \(n\) 为质数时，\(\varphi(n) = n-1\)，就等价于费马小定理。
由欧拉定理可以导出 \(a^b \equiv a^{b\bmod \varphi(n)} \pmod n\,(\gcd(a,n) = 1)\)。

扩展欧拉定理

对于任意的 \(a,n\) 与 \(b \ge \varphi(n)\)，有 \[a^b \equiv a^{b\bmod\varphi(n)+\varphi(n)} \pmod n\]

证明：
设 \(n = p^c \cdot s\)，其中 \(p\) 为一个质数，\(\gcd(p^c,s)=1\)（即提取 \(n\) 的一个质因子）。
根据欧拉定理，有 \(p^{\varphi(s)} \equiv 1 \pmod s\)。
而由于欧拉函数具有积性，可得 \(\varphi(s) \mathop{ \mid } \varphi(n)\)，故 \(p^{\varphi(s)} \equiv p^{\varphi(n)} \pmod n\)。
设 \(p^{\varphi(s)} = xs + 1\)，则 \(p^{\varphi(s) + c} = xn + p^c\)。
故 \(p^{\varphi(s) + c} \equiv p^c \pmod n\)。
根据以上过程同样可证 \(p^{\varphi(n) + c} \equiv p^c \pmod n\)。
当 \(b \ge c\) 时，\(p^c \equiv p^{b - c} \cdot p^{\varphi(n) + c} \equiv p^{b + \varphi(n)} \pmod n\)。
而由于 \(c \le \varphi(n)\)，当 \(b \ge 2\varphi(n)\) 时，\(p^b \equiv p^{b - \varphi(n)} \pmod n\)。
故 \(p^b \equiv p^{b\bmod\varphi(n) + \varphi(n)} \pmod n\)。

对于 \(a\) 的一个质因子 \(p\)，当 \(p \mathop{ \mid } n\)，根据以上过程可得 \(p^b \equiv p^{b\bmod\varphi(n) + \varphi(n)} \pmod n\) 成立；当 \(p \not\mathop{ \mid } n\)，根据欧拉定理同样可得上式成立。
故原式成立。
证毕。

其他（比较显然的）性质

\(\varphi(2n) = \varphi(n)\,(n \equiv 1 \pmod 2)\)。
\(\varphi(p^c) = p^c - p^{c-1}\)，其中 \(p\) 为质数。
\(\varphi(np) = \begin{cases}\varphi(n)p,&p\mathop{ \mid }n\\\varphi(n)(p-1),&p\not\mathop{ \mid }n\end{cases}\)，其中 \(p\) 为质数。
由通式显然易得。
由这条性质可以得出线性筛欧拉函数的方法。
对于 \(n > 2\)，\(\varphi(n) \equiv 0 \pmod n\)。
由更相减损术（\(\gcd(n,i) = \gcd(n,n-i)\,(n > i)\)）可得。
\(\sum\limits_{i=1}^n [\gcd(i,n)=1]i = \frac{\varphi(n)n + [n=1]}{2}\)。
同样由更相减损术可得，对于 \(n > 1\)，与 \(n\) 互质的数是成对出现的。
\(\sum\limits_{d \mid n} \varphi(d) = n\)。
证明：
将前 \(n\) 个正整数按与 \(n\) 的 \(\gcd\) 分类，则由于每个数与 \(n\) 的 \(\gcd\) 是唯一的，有 \(n = \sum\limits_{d \mid n} \sum\limits_{i=1}^n [\gcd(i,n)=d]\)。
而 \(\sum\limits_{i=1}^n [\gcd(i,n)=d] = \sum\limits_{d \mid i} [\gcd(i,n)=d] = \sum\limits_{i=1}^{\frac nd} [\gcd(i,n)=1] = \varphi(\frac nd)\)。
其中用到了 \(\gcd\left(\frac a{\gcd(a,b)},\frac b{\gcd(a,b)}\right) = 1\) 这个性质，用反证法易证。

欧拉反演

虽然是个假名字，但还挺有用的。
即利用 \(\sum\limits_{d \mid n} \varphi(d) = n\) 这条性质。
之所以叫欧拉反演，因为它可以用来做一些莫反的题，但局限性很强。

例：求 \(\sum\limits_{i=1}^n \sum\limits_{j=1}^n \gcd(i,j)\)。
则以 \(\sum\limits_{d \mid n} \varphi(d) = n\) 代入其中的 \(\gcd(i,j)\) 项可得 \(\sum\limits_{i=1}^n\sum\limits_{j=1}^n\sum\limits_{d \mid \gcd(i,j)} \varphi(d)\)。
接下来是反演题推导的一个常用套路：交换求和号。
一般的策略即在枚举约数时，考虑枚举约数，再考虑其倍数与其产生的贡献。
得 \(\sum\limits_{d=1}^n \varphi(d) \sum\limits_{i=1}^n\sum\limits_{j=1}^n [d\mathop{ \mid }\gcd(i,j)]\)。
注意到 \(d\mathop{ \mid }\gcd(i,j)\) 等价于 \(d\mathop{ \mid }i,d\mathop{ \mid }j\)，并且 \(i,j\) 的枚举之间互不影响，由乘法原理可得 \(\sum\limits_{i=1}^n\sum\limits_{j=1}^n [d\mathop{ \mid }\gcd(i,j)] = (\lfloor\frac nd\rfloor)^2\)。
故 \(\sum\limits_{d=1}^n \varphi(d) \sum\limits_{i=1}^n\sum\limits_{j=1}^n [d\mathop{ \mid }\gcd(i,j)] = \sum\limits_{d=1}^n \varphi(d) (\lfloor\frac nd\rfloor)^2\)。
看起来这个式子依然要 \(O(n)\) 来做。
但是，如果利用上文中提到的数论分块的技巧（\(f(n) = \varphi(n),g(n) = n^2\)），可以把复杂度降到 \(O(\sqrt n)\)（前提是线性筛出了欧拉函数的前缀和）。

莫比乌斯函数

莫比乌斯函数的定义式为 \(\mu(n) = \begin{cases}1,&n=1\\0,&\exists\ d>1,d^2 \mathop{ \mid } n\\(-1)^{\omega(n)}&,\text{otherwise}\end{cases}\)，其中 \(\omega(n)\) 表示 \(n\) 的不同质因子个数。
有的文献中也把定义式写作：设 \(n = \prod\limits_{i=1}^m p_i^{c_i}\)，则 \(\mu(n) = \begin{cases}1,&n=1\\0,&\exists\ c_i>1\\(-1)^m,&\forall\ c_i=1\end{cases}\)。
其实两者是等价的。

一个重要的性质

\(\sum\limits_{d \mid n} \mu(d) = [n=1]\)。
其实类似这种东西的证明可以根据积性，分解质因数后证明对于质数的幂成立，并证明原式。
这样子比较套路，这里有另外一种证明。

对于 \(n=1\)，原式显然成立。
对于 \(n>1\)，注意到若 \(d\) 有完全平方数因子（简称为平方因子），则 \(\mu(d)=0\)。
故有贡献的 \(d\) 肯定得在 \(n\) 的所有质因子中，每个至多取一个，然后乘起来得到。
此时 \(\mu(d) = (-1)^{\omega(d)}\)。
故 \(\sum\limits_{d \mid n}\mu(d) = \sum\limits_{i=1}^{\omega(n)} C_{\omega(n)}^i (-1)^i\)。
由二项式定理（\((a+b)^k = \sum\limits_{i=1}^k C_k^ia^ib^{k-i}\)）可知 \(\sum\limits_{i=1}^{\omega(n)} C_{\omega(n)}^i (-1)^i = \sum\limits_{i=1}^{\omega(n)} C_{\omega(n)}^i 1^{\omega(n)-i}(-1)^i = (1-1)^{\omega(n)} = 0\)。
证毕。

为什么称它为一个重要的性质呢，因为莫比乌斯反演的证明需要用到这个性质，所以它可以看作一个引理。
但这个引理的用途不止这点。

莫比乌斯反演

若有数论函数 \(f,F\) 满足 \(F(n) = \sum\limits_{d \mid n} f(d)\)，则 \(f(n) = \sum\limits_{d \mid n} \mu(\frac nd)F(d)\)。
以上即莫比乌斯反演公式。

证明：
将 \(F(n) = \sum\limits_{d \mid n} f(d)\) 代入上式，可得 \(\sum\limits_{d \mid n} \mu(\frac nd)\sum\limits_{k \mid d} f(k)\)。
考虑将 \(k\) 提到最前面，即 \(\sum\limits_{k \mid n} f(k)\sum\limits_{k \mid d,d \mid n} \mu(\frac nd)\)。
设 \(d = d' \cdot k\)，则由 \(d'\cdot k \mid n,k \mid n\) 可得 \(d' \mid \frac nk\)。
故 \(\sum\limits_{k \mid n} f(k)\sum\limits_{k \mid d,d \mid n} \mu(\frac nd) = \sum\limits_{k \mid n} f(k)\sum\limits_{d' \mid \frac nk} \mu(\frac n{d'k})\)。
注意到 \(\sum\limits_{d' \mid \frac nk} \mu(\frac n{d'k}) = \sum\limits_{d' \mid \frac nk} \mu(d') = [\frac nk=1] = [n=k]\)。
故原式成立。

不过一般会用到的是莫比乌斯反演公式的另一种形式：若 \(F(n) = \sum\limits_{n \mid d} f(d)\)，则 \(f(n) = \sum\limits_{n \mid d} \mu(\frac dn)F(d)\)。
证明方式类似。
其实在学到下文中的数论函数的狄利克雷卷积之后，莫比乌斯反演公式只需要几步即可证明。

然而实际上，通常情况下推导式子的时候使用莫比乌斯反演公式的话会非常麻烦，所以使用莫比乌斯函数的那个重要的性质足矣。

例：求 \(\sum\limits_{i=1}^n\sum\limits_{j=1}^m [\gcd(i,j) = k]\)。
首先 \(i,j\) 必为 \(k\) 的倍数，故 \(\sum\limits_{k \mid i}\sum\limits_{k \mid j} [\gcd(i,j)=k]\)。
同样用到 \(\gcd\left(\frac a{\gcd(a,b)},\frac b{\gcd(a,b)}\right)=1\) 的性质，得 \(\sum\limits_{i=1}^{\lfloor\frac nk\rfloor}\sum\limits_{j=1}^{\lfloor\frac nk\rfloor} [\gcd(i,j)=1]\)。
将 \(\sum\limits_{d \mid n} \mu(d) = [n=1]\) 代入 \([\gcd(i,j)=1]\)，得 \(\sum\limits_{i=1}^{\lfloor\frac nk\rfloor}\sum\limits_{j=1}^{\lfloor\frac nk\rfloor}\sum\limits_{d \mid \gcd(i,j)} \mu(d)\)。
将 \(d\) 提到最前面，得 \(\sum\limits_{d=1}^{\min(\lfloor\frac nk\rfloor,\lfloor\frac mk\rfloor)} \mu(d) \lfloor\frac n{dk}\rfloor\lfloor\frac m{dk}\rfloor\)。
做到这一步，就可以使用数论分块的技巧求解了，复杂度是 \(O\left(\sqrt{\frac nk} + \sqrt{\frac mk}\right)\)。
你可能会问两个参数该如何数论分块，实际上，只需要每次令 \(r = \min\left(\left\lfloor\frac{\lfloor\frac nk\rfloor}{\lfloor\frac n{kl}\rfloor}\right\rfloor,\left\lfloor\frac{\lfloor\frac mk\rfloor}{\lfloor\frac m{kl}\rfloor}\right\rfloor\right)\) 即可。
此题即「『POI2007』Queries」。

如果你有在认真读，可能会注意到我把 \(\left\lfloor\frac{\lfloor\frac nk\rfloor}d\right\rfloor\) 换成了 \(\lfloor\frac n{dk}\rfloor\)（另外一个也是）。
证明：
令 \(\frac nk = \lfloor\frac nk\rfloor + c\)，则 \(\frac n{dk} = \frac{\lfloor\frac nk\rfloor}d + \frac cd\)。
注意到 \(\frac{\lfloor\frac nk\rfloor}d \le \left\lfloor\frac{\lfloor\frac nk\rfloor}d\right\rfloor + \frac{d-1}d\) 且 \(\frac cd < \frac1d\)。
故 \(\lfloor\frac n{dk}\rfloor=\left\lfloor\frac{\lfloor\frac nk\rfloor}d + \frac cd\right\rfloor=\left\lfloor\frac{\lfloor\frac nk\rfloor}d\right\rfloor\)。
证毕。

掌握套路之后，不妨再做点题。
例（「『SDOI2015』约数个数和」）：求 \(\sum\limits_{i=1}^n\sum\limits_{j=1}^m\sigma_0(ij)\)。
这里需要用到一个性质：\(\sigma_0(ij) = \sum\limits_{x \mid i}\sum\limits_{y \mid j} [\gcd(x,y)=1]\)。
这个性质在我当时做这道题的时候并不会证明，当时写的题解中也没有写。
现在来证一下。

对于一个 \(d\mathop{ \mid }ij\)，令 \(x = \frac i{\gcd(i,d)},y = \frac d{\gcd(i,d)}\)。
则显然易得 \(\gcd(x,y)=1,x\mathop{ \mid }i\)。
由 \(y\gcd(i,d)\mathop{ \mid }ij\) 可得 \(y\mathop{ \mid }xj\)，又因为 \(\gcd(x,y)=1\)，故 \(y\mathop{ \mid }j\)。
于是可得 \(\gcd(x,y)=1,x\mathop{ \mid }i,y\mathop{ \mid }j\)。
而对于任意的 \(\gcd(x,y)=1,x\mathop{ \mid }i,y\mathop{ \mid }j\) 都可以得到 \(\frac{i \cdot y}x\mathop{ \mid }ij\)，并且与所有的 \(d\mathop{ \mid }ij\) 一一对应。
故原式得证。

然后接着来推导，这里就直接略去文字注释了： \[ \begin{align*} \sum\limits_{i=1}^n\sum\limits_{j=1}^m\sigma_0(ij) & = \sum\limits_{i=1}^n\sum\limits_{j=1}^m\sum\limits_{x \mid i}\sum\limits_{y \mid j}[\gcd(x,y)=1] \\ & = \sum\limits_{i=1}^n\sum\limits_{j=1}^m\sum\limits_{x \mid i}\sum\limits_{y \mid j}\sum\limits_{d \mid \gcd(x,y)}\mu(d) \\ & = \sum\limits_{d=1}^{\min(n,m)}\mu(d)\sum\limits_{d \mid x}\sum\limits_{d \mid y}\sum\limits_{x \mid i}\sum\limits_{y \mid i} 1 \\ & = \sum\limits_{d=1}^{\min(n,m)}\mu(d)\sum\limits_{d \mid x}\sum\limits_{d \mid y}\left\lfloor\frac nx\right\rfloor\left\lfloor\frac my\right\rfloor \\ & = \sum\limits_{d=1}^{\min(n,m)}\mu(d)\sum\limits_{x=1}^{\lfloor\frac nd\rfloor}\sum\limits_{y=1}^{\lfloor\frac md\rfloor}\left\lfloor\frac n{d\cdot x}\right\rfloor\left\lfloor\frac m{d\cdot y}\right\rfloor \\ & = \sum\limits_{d=1}^{\min(n,m)}\mu(d)f\left(\left\lfloor\frac nd\right\rfloor\right)f\left(\left\lfloor\frac md\right\rfloor\right) \end{align*} \]

之所以把后面的东西写成函数，是因为这两个式子只和 \(\lfloor\frac nd\rfloor,\lfloor\frac md\rfloor\) 有关。
易知 \(f(n) = \sum\limits_{i=1}^n \lfloor\frac ni\rfloor\)。
这题数据范围比较小，所以说直接暴力预处理 \(O(n \sqrt n)\) 是可以过的（视 \(n,m\) 同阶）。

但是如果数据范围开到 \(10^8\)（不考虑多组数据）？
不做预处理，直接在用到的时候暴力跑，因为 \(f\) 函数只需要用到形如 \(\lfloor\frac ni\rfloor\) 处的值。
复杂度是 \(O\left(\sum\limits_{i=1}^{\lfloor\sqrt n\rfloor}\left(\sqrt i + \sqrt{\frac ni}\right)\right) = O\left(\int_1^{\sqrt n}\sqrt{\frac nx}\text{d}x\right) = O(n^{3/4})\)。
（实际上如果使用杜教筛求 \(\mu\) 前缀和的话，可以做到总共 \(O(n^{2/3})\)）

然而实际上 \(f\) 函数是可以使用线性筛求出的。
注意到 \[ \begin{align*} f(n) & = \sum\limits_{i=1}^n \left\lfloor\frac ni\right\rfloor \\ & = \sum\limits_{i=1}^n \sum\limits_{i \mid d} 1 \\ & = \sum\limits_{d=1}^n \sigma_0(d) \end{align*} \] 于是 \(f\) 其实就是 \(\sigma_0\) 的前缀和。
线性筛出 \(\sigma_0\) 即可。
具体方式是根据约数个数定理（\(\sigma_0(n) = \prod\limits_{i=1}^m (c_i+1)\)，\(c_i\) 是前文提到的质因子分解的形式），线性筛时记录最小质因子的次数即可（因为只会被最小质因子筛到）。

在下文中还会再提到此题的 \(O(n^{2/3})\) 做法。

更多的习题还可以在我博客的莫比乌斯反演标签中找到。

狄利克雷卷积

定义两个数论函数 \(f,g\) 的狄利克雷卷积 \(f*g\) 仍然是一个数论函数，且 \((f*g)(n) = \sum\limits_{d \mid n}f(d)g(\frac nd)\)。
狄利克雷卷积满足交换律 \(f*g=g*f\)，结合律 \((f*g)*h=f*(g*h)\)。
此处证明略去。

根据上文可得 \(\mu*\textbf1=\epsilon,\varphi*\textbf1=\textbf{ID},f * \epsilon = f\)。

上文中有提到莫比乌斯反演公式的狄利克雷卷积证明，即证明 \(F = f*\textbf1\) 有 \(f = \mu * F\)。
证明：将 \(F\) 代入后式，得 \(f = \mu * (f * \textbf1)\)。
根据交换律与结合律得 \(f = (\mu * \textbf1) * f = \epsilon * f = f\)，故得证。

数论函数前缀和

我们常常会遇到数论函数的前缀和问题，尽管有时只是核心算法的一部分。
而很多时候，我们需要的是所有 \(\lfloor\frac ni\rfloor\) 处的前缀和值。
然后呢，有一种常用的算法，可以用来对一些常见的数论函数解决这个问题。

杜教筛

对于积性函数 \(f,g,h = f*g\)，考虑 \(\sum\limits_{i=1}^n h(i)\)。
有 \[ \begin{align*} \sum\limits_{i=1}^n h(i) & = \sum\limits_{i=1}^n\sum\limits_{d \mid i} g(d)f\left(\frac id\right) \\ & = \sum\limits_{d=1}^ng(d)\sum\limits_{d \mid i}f\left(\frac id\right) \\ & = \sum\limits_{d=1}^ng(d)\sum\limits_{i=1}^{\lfloor\frac nd\rfloor} f(i) \end{align*} \]

令 \(S(n) = \sum\limits_{i=1}^n f(i)\)，则原式即 \(\sum\limits_{d=1}^ng(d)S(\lfloor\frac nd\rfloor)\)。
从和式中提出 \(d=1\) 一项，得 \(\sum\limits_{i=1}^n h(i) = g(1)S(n) + \sum\limits_{d=2}^n g(d)S(\lfloor\frac nd\rfloor)\)。
注意到 \(g(1)=1\)，故 \(S(n) = \sum\limits_{i=1}^n h(i) - \sum\limits_{d=2}^n g(d)S(\lfloor\frac nd\rfloor)\)。

若能较快地求出 \(g,h\) 的前缀和，即可递归地求 \(S(n)\)。
记忆化之后，实际上就是对于所有 \(\lfloor\frac ni\rfloor\) 花费了 \(O\left(\sqrt{\frac ni}\right)\) 的复杂度。
总复杂度即 \[O\left(\sum\limits_{i=1}^{\lfloor\sqrt n\rfloor}\sqrt i+\sqrt{\frac ni}\right) = O\left(\int_1^{\sqrt n}\sqrt{\frac nx}\text dx\right) = O(n^{3/4})\] 若预处理 \(n^c\,(c > \frac12)\) 以内的值，则复杂度变为 \(O(n^c + n^{1-\frac c2})\)。
当 \(c = \frac23\) 时两项平均达到最优值 \(O(n^{2/3})\)。

另一种利用狄利克雷卷积的技巧

如果我们有 \(f = g*h\)，而要求 \(\sum\limits_{i=1}^n f(i)\)，则可以做得更简单一点。

\[ \begin{align*} \sum\limits_{i=1}^nf(i) =&\sum\limits_{i=1}^n\sum\limits_{d \mid i}g(d)h\left(\frac id\right) \\ =&\sum\limits_{d=1}^n g(d)\sum\limits_{d \mid i}h\left(\frac id\right) \\ =&\sum\limits_{d=1}^n g(d)\sum\limits_{i=1}^{\left\lfloor\frac nd\right\rfloor}h(i) \end{align*} \]

于是只需要求得 \(g,h\) 的前缀和即可。
用和杜教筛类似的预处理方式可以做到同样的 \(O(n^{2/3})\)。

应用

求 \(\mu\) 的前缀和：
注意到 \(\mu*1=\epsilon\)，使用杜教筛即可。
求 \(\varphi\) 的前缀和：
注意到 \(\varphi*1=\textbf{ID}\)，使用杜教筛即可。
求 \(\sigma_0\) 的前缀和：
注意到 \(\sigma_0=1*1\)，使用另一种技巧即可。
求 \((\mu \cdot \textbf{ID})*1\) 的前缀和：
首先使用另一种技巧转化为求 \(\mu \cdot \textbf{ID}\) 的前缀和。
然后注意到 \((\mu \cdot \textbf{ID}) * \textbf{ID}=\epsilon\)。
使用杜教筛即可。
需要注意的是预处理可能会比较麻烦，不过可以在质数次幂处分类讨论。
可参考 EI 的「复杂度分析：积性函数的狄利克雷卷积」。
求 \(\varphi * \textbf{ID}\) 的前缀和：
直接使用另一种技巧即可。

扯淡

某些特殊的函数除了这些基本套路以外，还有别的做法。
比如求 \(\mu^2\) 的前缀和，可以通过 \(\mu\) 的定义得到 \(O(n^{3/5})\) 的做法（如果只要求 \(n\) 处的前缀和，可以 \(O(n^{1/3})\))。
这里就不扯了，读者可以自己思考。

『My guiding star.』

「从零开始的莫比乌斯反演 & 杜教筛」

数论分块

参考代码

筛法

埃氏筛

时间复杂度

欧拉筛 / 线性筛

参考代码

时间复杂度

数论函数

定义

积性函数

（比较显然的）性质

欧拉函数

通式

性质及证明

欧拉定理

扩展欧拉定理

其他（比较显然的）性质

欧拉反演

莫比乌斯函数

一个重要的性质

莫比乌斯反演

狄利克雷卷积

数论函数前缀和

杜教筛

另一种利用狄利克雷卷积的技巧

应用

扯淡