多元函数微积分

参考资料

引入

一元微积分推广到多元：

导数 $\to$ 偏导数 / 方向导数 / 梯度。
定积分 $\to$ 二重 / 三重积分 / 曲线积分 / 曲面积分。
微积分基本定理 $\to$ 格林公式 / 高斯公式 / 斯托克斯公式。

推广的难点在于「方向变多了」。一元函数在一点只能左右走，多元函数却能朝无穷多个方向走，于是「变化率」这件事必须先说清「沿哪个方向」——偏导数、方向导数、梯度都是为回答这个问题而生。

多元函数

极限与连续

\lim_{(x,y)\to(x_0,y_0)}f(x,y)=A

要求 $(x,y)$ 沿 任何路径 趋近 $(x_0,y_0)$ 时极限都相同。

这是多元极限最棘手的地方：一元只有左右两条路，多元有无穷多条路（直线、抛物线、螺旋……）。只要找到两条路径让极限值不同，极限就不存在。 经典反例 $f=\dfrac{xy}{x^2+y^2}$ 在原点，沿 $y=kx$ 趋近会得到随 $k$ 变化的值 $\dfrac{k}{1+k^2}$ ，故极限不存在。连续的定义照旧： $\lim\limits_{(x,y)\to(x_0,y_0)}f=f(x_0,y_0)$ ，初等函数在定义区域内仍处处连续。

偏导数

f_x(x_0,y_0)=\lim_{\Delta x\to 0}\frac{f(x_0+\Delta x,y_0)-f(x_0,y_0)}{\Delta x}

记号： $\dfrac{\partial f}{\partial x}$ 、 $f_x$ 、 $\partial_x f$ 。

偏导的做法就一句话：对哪个变量求导，就把其余变量统统当常数。 几何上， $f_x(x_0,y_0)$ 是曲面 $z=f(x,y)$ 被平面 $y=y_0$ 截出的那条曲线在该点的切线斜率——只沿 $x$ 轴方向看曲面的陡峭程度。 $f_y$ 同理沿 $y$ 方向。

混合偏导 $f_{xy}$ 与 $f_{yx}$ 在二者连续时相等（求导次序可交换）。

例： $f=x^3 y^2+\sin(xy)$ 。对 $x$ 求偏导时把 $y$ 当常数：

f_x=3x^2 y^2+y\cos(xy),f_y=2x^3 y+x\cos(xy)

混合偏导 $f_{xy}=\dfrac{\partial}{\partial y}(3x^2 y^2+y\cos xy)=6x^2 y+\cos xy-xy\sin xy$ ，可验证 $f_{yx}$ 给出同一结果。

全微分

\mathrm{d}z=\frac{\partial z}{\partial x}\mathrm{d}x+\frac{\partial z}{\partial y}\mathrm{d}y

全微分是用 切平面 代替曲面：函数的真实增量 $\Delta z$ 约等于沿 $x$ 、 $y$ 两个方向的线性增量之和。它把一元的「切线近似」升级成「切平面近似」。

例（全微分作近似）：估 $(1.02)^{3.01}$ 。取 $f(x,y)=x^y$ 、 $(x_0,y_0)=(1,3)$ 。 $f_x=yx^{y-1}$ 、 $f_y=x^y\ln x$ ，在 $(1,3)$ 处 $f_x=3$ 、 $f_y=0$ 、 $f=1$ 。于是：

(1.02)^{3.01}\approx f+f_x\Delta x+f_y\Delta y=1+3\times 0.02+0\times 0.01=1.06

$f_y=0$ 是因为 $\ln 1=0$ ，所以 $y$ 的微小变化几乎不影响结果。

可微性的逻辑链需要分清：

\text{偏导连续}\implies\text{可微}\implies \begin{cases} \text{连续} \\ \text{偏导存在} \end{cases}

反向都不成立。特别注意 偏导存在不一定可微——偏导只管住 $x$ 、 $y$ 两个坐标方向，可微却要求切平面在 所有方向 都贴合曲面，是强得多的条件。

链式法则

若 $z=f(u,v),u=u(x,y),v=v(x,y)$ ：

\frac{\partial z}{\partial x}=\frac{\partial z}{\partial u}\frac{\partial u}{\partial x}+\frac{\partial z}{\partial v}\frac{\partial v}{\partial x}

和一元链式法则同理，只是 $x$ 通过 多条路径（经 $u$ 、经 $v$ ）影响 $z$ ，每条路径贡献一项，最后求和。画一张「变量依赖图」，从 $z$ 到 $x$ 有几条通路就有几个加项，每条通路上的偏导相乘——这是多元求导不出错的实用技巧。

隐函数求导

由 $F(x,y)=0$ 确定 $y=y(x)$ ：

\frac{\mathrm{d}y}{\mathrm{d}x}=-\frac{F_x}{F_y}

由 $F(x,y,z)=0$ 确定 $z=z(x,y)$ ：

\frac{\partial z}{\partial x}=-\frac{F_x}{F_z},\frac{\partial z}{\partial y}=-\frac{F_y}{F_z}

这些公式由「对 $F=0$ 两端求全微分、再解出待求偏导」得到，避免了显式解出 $y$ 或 $z$ 。前提是分母（如 $F_y$ 、 $F_z$ ）不为零，这正是 隐函数定理 保证局部能解出函数的条件。

方向导数与梯度

方向导数：函数沿单位向量 $\vec l=(\cos\alpha,\cos\beta)$ 的变化率。

\frac{\partial f}{\partial\vec l}=f_x\cos\alpha+f_y\cos\beta=\nabla f\cdot\vec l

偏导只测坐标轴方向的陡度，方向导数测 任意指定方向 的陡度——把它写成梯度与方向向量的点积，是理解梯度的钥匙。

梯度：

\nabla f=\left(\frac{\partial f}{\partial x},\frac{\partial f}{\partial y},\frac{\partial f}{\partial z}\right)

提示

梯度指向函数 上升最快 的方向，其模 $|\nabla f|$ 是该方向的（最大）变化率。原因藏在点积里： $\dfrac{\partial f}{\partial\vec l}=\nabla f\cdot\vec l=|\nabla f|\cos\theta$ ， $\theta$ 是 $\vec l$ 与梯度的夹角。当 $\vec l$ 与梯度同向（ $\theta=0$ ）时变化率最大、反向最小、垂直时为零。所以「站在山坡上、朝梯度方向迈步爬升最快」，而 梯度处处垂直于等值线 / 等高面。这是机器学习里梯度下降法的几何根基。

例（方向导数与最大变化率）： $f=x^2+xy+y^2$ 在点 $(1,1)$ 处沿 $\vec a=(3,4)$ 的方向导数。先求梯度 $\nabla f=(2x+y,x+2y)$ ，在 $(1,1)$ 处为 $(3,3)$ 。 $\vec a$ 的单位向量是 $\vec l=\left(\dfrac35,\dfrac45\right)$ ，故：

\frac{\partial f}{\partial\vec l}=\nabla f\cdot\vec l=3\cdot\frac{3}{5}+3\cdot\frac{4}{5}=\frac{21}{5}

而该点变化率的最大值就是 $|\nabla f|=\sqrt{3^2+3^2}=3\sqrt2$ ，在沿梯度方向 $(1,1)$ 时取得。

多元函数极值

无条件极值

必要条件： $f_x=f_y=0$ （驻点，对应切平面水平）。

充分条件用二阶偏导判别（类比一元的 $f''$ ）。设 $A=f_{xx},B=f_{xy},C=f_{yy}$ ， $\Delta=AC-B^2$ ：

$\Delta>0$	$\Delta<0$	$\Delta=0$
$A>0$ 极小， $A<0$ 极大	非极值（鞍点）	不定，需另判

$\Delta<0$ 对应鞍点——形如马鞍，沿一个方向是谷底、沿另一方向是山顶，所以不是极值。这是多元才有的新现象，一元没有对应物。

例：求 $f=x^3-3xy+y^3$ 的极值。解驻点 $f_x=3x^2-3y=0$ 、 $f_y=-3x+3y^2=0$ ，即 $y=x^2$ 、 $x=y^2$ ，得 $(0,0)$ 与 $(1,1)$ 。二阶偏导 $A=f_{xx}=6x$ 、 $B=f_{xy}=-3$ 、 $C=f_{yy}=6y$ ， $\Delta=AC-B^2=36xy-9$ ：

在 $(0,0)$ ： $\Delta=-9<0$ ，是鞍点。
在 $(1,1)$ ： $\Delta=36-9=27>0$ 且 $A=6>0$ ，是 极小值， $f(1,1)=-1$ 。

条件极值：拉格朗日乘数法

求 $f(x,y)$ 在约束 $g(x,y)=0$ 下的极值，构造 拉格朗日函数（Lagrange Function）：

L(x,y,\lambda)=f(x,y)+\lambda g(x,y)

令 $L_x=L_y=L_\lambda=0$ 联立求解，得到候选点。

提示

几何直觉：在约束曲线上找 $f$ 的极值，相当于看着 $f$ 的等高线沿约束线移动。极值出现在等高线 恰好与约束线相切 的地方——此时若再沿约束线挪一点， $f$ 不再增减。相切意味着两条曲线的法向量平行，即 $\nabla f=-\lambda\nabla g$ ，这正是拉格朗日条件。乘数 $\lambda$ 衡量「放松约束一点点能让 $f$ 改善多少」。

例：求 $f=xy$ 在约束 $x^2+y^2=1$ 下的最值。构造 $L=xy+\lambda(x^2+y^2-1)$ ，令：

\begin{aligned} L_x & =y+2\lambda x=0 \\ L_y & =x+2\lambda y=0 \\ L_\lambda & =x^2+y^2-1=0 \end{aligned}

前两式相除（或联立）得 $y^2=x^2$ ，代入约束得 $x^2=y^2=\dfrac12$ 。于是 $f=xy=\pm\dfrac12$ ：最大值 $\dfrac12$ （取 $x=y=\dfrac{1}{\sqrt2}$ ），最小值 $-\dfrac12$ 。联立后常用「两式相除消 $\lambda$ 」快速得到变量间关系，再回代约束。

重积分

二重积分

\iint_D f(x,y)\mathrm{d}\sigma

几何上是 曲顶柱体的体积：底是平面区域 $D$ ，顶是曲面 $z=f(x,y)$ 。计算思路是「切成片再累加」，化为 二次积分（先对一个变量积分、把结果再对另一个积分）。

直角坐标： $\mathrm{d}\sigma=\mathrm{d}x\mathrm{d}y$ ，按 $X$ -型或 $Y$ -型区域定内外层积分限。选哪种次序取决于 哪种区域描述更简单，必要时交换次序。
极坐标： $\mathrm{d}\sigma=r\mathrm{d}r\mathrm{d}\theta$ 。当区域是圆 / 扇形、被积函数含 $x^2+y^2$ 时首选。那个多出来的 $r$ 是 面积元的拉伸因子（极坐标下小块面积是 $r\mathrm{d}r\mathrm{d}\theta$ ，离原点越远扇环越宽）。

对称性 能大幅简化计算：若区域关于 $x$ 轴对称、被积函数关于 $y$ 为奇函数，则积分为 $0$ ；为偶函数则取一半区域积分再乘 $2$ 。

例（直角坐标 + 换序）： $\displaystyle\int_0^1\int_x^1 e^{y^2}\mathrm{d}y\mathrm{d}x$ 。内层 $\int e^{y^2}\mathrm{d}y$ 积不出，必须 交换次序。原区域是 $0\le x\le y\le 1$ 的三角形，换成先对 $x$ 后对 $y$ ：

\int_0^1\int_0^y e^{y^2}\mathrm{d}x\mathrm{d}y=\int_0^1 ye^{y^2}\mathrm{d}y=\frac{1}{2} e^{y^2}\Big|_0^1=\frac{e-1}{2}

换序后内层多出的因子 $y$ 恰好凑成 $\mathrm{d}(y^2)$ ，积分迎刃而解。遇到内层积不出，优先想换序。

例（极坐标）： $\displaystyle\iint_D e^{-(x^2+y^2)}\mathrm{d}\sigma$ ， $D$ 是圆 $x^2+y^2\le R^2$ 。被积含 $x^2+y^2$ 、区域是圆，改极坐标 $x^2+y^2=r^2$ 、 $\mathrm{d}\sigma=r\mathrm{d}r\mathrm{d}\theta$ ：

\int_0^{2\pi}\int_0^R e^{-r^2}r\mathrm{d}r\mathrm{d}\theta=2\pi\cdot\left[-\frac{1}{2} e^{-r^2}\right]_0^R=\pi\left(1-e^{-R^2}\right)

那个多出来的 $r$ 让 $e^{-r^2}r$ 可凑微分——这正是极坐标处理高斯型积分的妙处。

三重积分

\iiint_\Omega f(x,y,z)\mathrm{d}V

坐标系	体积元	适用
直角坐标	$\mathrm{d}V=\mathrm{d}x\mathrm{d}y\mathrm{d}z$	长方体类区域
柱坐标	$\mathrm{d}V=r\mathrm{d}r\mathrm{d}\theta\mathrm{d}z$	圆柱、旋转体（绕轴对称）
球坐标	$\mathrm{d}V=\rho^2\sin\varphi\mathrm{d}\rho\mathrm{d}\varphi\mathrm{d}\theta$	球、含 $x^2+y^2+z^2$ 的被积函数

柱坐标 = 极坐标加一根 $z$ 轴；球坐标用「到原点距离 $\rho$ + 两个角度」定位。体积元里的 $r$ 和 $\rho^2\sin\varphi$ 都是坐标变换的 雅可比因子，本质是「换坐标后小体积块被拉伸了多少」。

例（柱坐标）：求 $\displaystyle\iiint_\Omega(x^2+y^2)\mathrm{d}V$ ， $\Omega$ 是 $x^2+y^2\le 1$ 、 $0\le z\le 2$ 的圆柱。改柱坐标 $x^2+y^2=r^2$ 、 $\mathrm{d}V=r\mathrm{d}r\mathrm{d}\theta\mathrm{d}z$ ：

\int_0^{2\pi}\int_0^1\int_0^2 r^2\cdot r\mathrm{d}z\mathrm{d}r\mathrm{d}\theta=2\pi\cdot 2\cdot\int_0^1 r^3\mathrm{d}r=4\pi\cdot\frac{1}{4}=\pi

例（球坐标）：求半径 $R$ 的球 $\Omega$ 内 $\displaystyle\iiint_\Omega\sqrt{x^2+y^2+z^2}\mathrm{d}V$ 。被积是 $\rho$ 、区域是球，用球坐标 $\mathrm{d}V=\rho^2\sin\varphi\mathrm{d}\rho\mathrm{d}\varphi\mathrm{d}\theta$ ：

\int_0^{2\pi}\int_0^\pi\int_0^R\rho\cdot\rho^2\sin\varphi\mathrm{d}\rho\mathrm{d}\varphi\mathrm{d}\theta =2\pi\cdot\Big[-\cos\varphi\Big]_0^\pi\cdot\frac{R^4}{4}=2\pi\cdot 2\cdot\frac{R^4}{4}=\pi R^4

三个变量的积分 完全分离、各自独立积出——这是球对称问题用球坐标的最大便利。

曲线积分

第一类（对弧长）

\int_L f(x,y)\mathrm{d}s=\int_\alpha^\beta f(\varphi(t),\psi(t))\sqrt{\varphi'^2+\psi'^2}\mathrm{d}t

物理意义是 变密度曲线的质量： $f$ 是线密度，沿曲线累加。它 与方向无关（弧长 $\mathrm{d}s$ 永远为正）。

例：算 $\displaystyle\int_L(x^2+y^2)\mathrm{d}s$ ， $L$ 是圆 $x=\cos t,y=\sin t$ （ $0\le t\le 2\pi$ ）。在 $L$ 上 $x^2+y^2=1$ ，弧长元 $\mathrm{d}s=\sqrt{(-\sin t)^2+(\cos t)^2}\mathrm{d}t=\mathrm{d}t$ ，故：

\int_L(x^2+y^2)\mathrm{d}s=\int_0^{2\pi}1\cdot 1\mathrm{d}t=2\pi

第二类（对坐标）

\int_L P\mathrm{d}x+Q\mathrm{d}y

物理意义是 变力沿曲线做的功： $\vec F=(P,Q)$ 是力场，沿路径累加力在位移方向的分量。它 与方向有关，反向取负号——逆着走，做的功反号。

例：算 $\displaystyle\int_L x\mathrm{d}y-y\mathrm{d}x$ ， $L$ 是从 $(1,0)$ 沿单位圆逆时针到 $(0,1)$ 。参数化 $x=\cos t,y=\sin t$ ， $t$ 从 $0$ 到 $\dfrac\pi2$ ， $\mathrm{d}x=-\sin t\mathrm{d}t$ 、 $\mathrm{d}y=\cos t\mathrm{d}t$ ：

\int_0^{\pi/2}\bigl[\cos t\cdot\cos t-\sin t\cdot(-\sin t)\bigr]\mathrm{d}t=\int_0^{\pi/2}1\mathrm{d}t=\frac{\pi}{2}

第二类曲线积分先参数化、把 $\mathrm{d}x,\mathrm{d}y$ 都换成 $\mathrm{d}t$ ，化成一元定积分。

曲面积分

第一类（对面积）

\iint_\Sigma f(x,y,z)\mathrm{d}S

是曲线积分对弧长的升维：变密度曲面的质量，与侧无关。

第二类（对坐标）

\iint_\Sigma P\mathrm{d}y\mathrm{d}z+Q\mathrm{d}z\mathrm{d}x+R\mathrm{d}x\mathrm{d}y

物理意义是 流量 / 通量：向量场 $\vec F=(P,Q,R)$ 穿过曲面 $\Sigma$ 的净流量。它 与侧有关，反侧取负——流入还是流出，符号相反。

三大公式

这三个公式是多元微积分的顶峰，把 边界上的积分 等于 内部的积分，都是牛顿-莱布尼茨公式在高维的化身。

格林公式（平面）

\oint_L P\mathrm{d}x+Q\mathrm{d}y=\iint_D\left(\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}\right)\mathrm{d}\sigma

把平面闭曲线 $L$ 上的第二类曲线积分，换成它围住区域 $D$ 上的二重积分。右端的 $\dfrac{\partial Q}{\partial x}-\dfrac{\partial P}{\partial y}$ 是向量场的旋度（平面版），度量场的「打旋」程度；左端是沿边界的环量。

例（格林公式算环量）：算 $\displaystyle\oint_L(x-y)\mathrm{d}x+x\mathrm{d}y$ ， $L$ 是单位圆逆时针。这里 $P=x-y$ 、 $Q=x$ ， $\dfrac{\partial Q}{\partial x}-\dfrac{\partial P}{\partial y}=1-(-1)=2$ ，转成二重积分：

\oint_L(x-y)\mathrm{d}x+x\mathrm{d}y=\iint_D 2\mathrm{d}\sigma=2\cdot(\text{圆面积})=2\pi

直接参数化也能算，但格林公式把沿边界的积分一步换成区域上常数的积分，省事得多。

提示

格林公式还给出 用曲线积分算面积 的公式：取 $P=-\dfrac y2$ 、 $Q=\dfrac x2$ 使 $\dfrac{\partial Q}{\partial x}-\dfrac{\partial P}{\partial y}=1$ ，则：

A=\frac{1}{2}\oint_L x\mathrm{d}y-y\mathrm{d}x

只用边界信息就能求出围住的面积，是行星扫面积、求多边形面积（鞋带公式）的连续版本。

高斯公式（散度定理）

\oiint_\Sigma P\mathrm{d}y\mathrm{d}z+Q\mathrm{d}z\mathrm{d}x+R\mathrm{d}x\mathrm{d}y=\iiint_\Omega\left(\frac{\partial P}{\partial x}+\frac{\partial Q}{\partial y}+\frac{\partial R}{\partial z}\right)\mathrm{d}V

把闭曲面 $\Sigma$ 上的通量，换成它围住的立体 $\Omega$ 内部散度的体积分。散度 $\nabla\cdot\vec F$ 度量某点是「源」（向外冒）还是「汇」（向内吸）。直觉：穿过表面的净流量，等于内部所有源汇的总和——内部冒出来的，最终都得从表面流出去。

例（高斯公式算通量）：求 $\vec F=(x,y,z)$ 穿过半径 $R$ 球面 $\Sigma$ （外侧）的通量。散度 $\nabla\cdot\vec F=1+1+1=3$ ，转成体积分：

\oiint_\Sigma x\mathrm{d}y\mathrm{d}z+y\mathrm{d}z\mathrm{d}x+z\mathrm{d}x\mathrm{d}y=\iiint_\Omega 3\mathrm{d}V=3\cdot\frac{4}{3}\pi R^3=4\pi R^3

直接在球面上算曲面积分相当麻烦，高斯公式把它化成「常数 × 体积」。遇到闭曲面通量、被积式散度简单时，首选高斯公式。

斯托克斯公式

\oint_L P\mathrm{d}x+Q\mathrm{d}y+R\mathrm{d}z=\iint_\Sigma(\nabla\times\vec F)\cdot\mathrm{d}\vec S

是格林公式的空间推广：空间闭曲线 $L$ 上的环量，等于以 $L$ 为边界的曲面 $\Sigma$ 上 旋度的通量。旋度 $\nabla\times\vec F$ 是个向量，指向「旋转轴」方向、模为旋转强度。

例（斯托克斯公式算环量）： $\vec F=(-y,x,z)$ ， $L$ 是平面 $z=0$ 上的单位圆（逆时针）。旋度：

\nabla\times\vec F=\left(\frac{\partial R}{\partial y}-\frac{\partial Q}{\partial z},\frac{\partial P}{\partial z}-\frac{\partial R}{\partial x},\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}\right)=(0,0,2)

取 $\Sigma$ 为 $L$ 围住的圆盘（法向量 $\vec n=(0,0,1)$ ），旋度通量 $=\displaystyle\iint_\Sigma 2\mathrm{d}S=2\pi$ ，即 $\displaystyle\oint_L\vec F\cdot\mathrm{d}\vec r=2\pi$ 。先算旋度、选最简单的张曲面，再积旋度的通量。

提示

把三大公式连同牛顿-莱布尼茨公式放在一起看，是同一个思想在不同维度的复奏：边界上的积分 = 内部某种「导数」的积分。

一维： $\displaystyle\int_a^b F'(x)\mathrm{d}x=F(b)-F(a)$ （区间内部 vs 两端点）。
格林 / 斯托克斯：曲线环量 vs 曲面旋度。
高斯：曲面通量 vs 体积散度。

它们在微分形式的语言里统一为一条 广义斯托克斯公式 $\int_{\partial\Omega}\omega=\int_\Omega\mathrm{d}\omega$ 。

参考资料​

引入​

多元函数​

极限与连续​

偏导数​

全微分​

链式法则​

隐函数求导​

方向导数与梯度​

多元函数极值​

无条件极值​

条件极值：拉格朗日乘数法​

重积分​

二重积分​

三重积分​

曲线积分​

第一类（对弧长）​

第二类（对坐标）​

曲面积分​

第一类（对面积）​

第二类（对坐标）​

三大公式​

格林公式（平面）​

高斯公式（散度定理）​

斯托克斯公式​

参考资料

引入

多元函数

极限与连续

偏导数

全微分

链式法则

隐函数求导

方向导数与梯度

多元函数极值

无条件极值

条件极值：拉格朗日乘数法

重积分

二重积分

三重积分

曲线积分

第一类（对弧长）

第二类（对坐标）

曲面积分

第一类（对面积）

第二类（对坐标）

三大公式

格林公式（平面）

高斯公式（散度定理）

斯托克斯公式