形式理论
线性代数和希尔伯特空间
波函数和算符是量子力学的两大基石。wave functions用来描述某个particle或者某个系统现在的状态,本质是向量vectors;operators是为了描述可观测的物理量,本质是线性变换(linear tranformation)。因此量子力学的自然语言是线性代数。
矢量$$|\alpha\rangle \rightarrow \mathbf{a}=\left(\begin{array}{l} a_{1} \\ a_{2} \\ \vdots \\ a_{N} \end{array}\right)$$内积$$\langle\alpha | \beta\rangle=a_{1}^{*} b_{1}+a_{2}^{*} b_{2}+\cdots a_{N}^{*} b_{N}$$
- \(|\beta\rangle\)为【右矢】,叫作ket \(\beta\);\(\langle\alpha|\)为【左矢】,叫作bra \(\alpha \);
- 将右矢取“厄米共轭”,也就是将右矢先转置,再取共轭,即得到左矢;
- \(|\psi\rangle\)对应于波函数\(\psi(x)\),\(\langle\psi|\)对应于波函数\(\psi^{*}(x)\);
- 对于有限维矢量空间,上面的右矢\(|\alpha\rangle\)对应的左矢可以表示为\( \langle \alpha |=\left(\begin{array}{llllll} a_{1}^{*} & a_{2}^{*} & . & . & . & a_{n}^{*} \end{array}\right)\)
所有的左矢集合构成了另外一个矢量空间 — 所谓的【对偶空间】(dual space)。 - 对于无限维矢量空间,左矢\(\langle f|\)可以看作是线性空间到对应标量域的线性映射,即【线性泛函】\(\langle f|\)可以认为是对积分\(\langle f|=\displaystyle\int f^{*}[\cdots] d x\)的指定,\([\cdots]\)为被作用的向量(函数)。
- \( \langle\alpha | \beta\rangle\)表示的是复数内积,得到的是一个数。
Commutator $$[A, B]=A B-B A$$线性变换$$|\beta\rangle=T|\alpha\rangle \rightarrow \mathbf{b}=\mathbf{T} \mathbf{a}=\left(\begin{array}{cccc} t_{11} & t_{12} & \cdots & t_{1 N} \\ t_{21} & t_{22} & \cdots & t_{2 N} \\ \vdots & \vdots & & \vdots \\ t_{N 1} & t_{N 2} & \cdots & t_{N N} \end{array}\right)\left(\begin{array}{l} a_{1} \\ a_{2} \\ \vdots \\ a_{N} \end{array}\right)$$提取算符(矩阵)中的任意位置的值$$t_{i j}=\langle x_{i}|\hat{T}| x_{j}\rangle$$转置$$ \widetilde{(A B)}=\tilde{B} \tilde{A} $$厄米共轭$$ (A B)^{*}=B^{*} A^{*} $$
- 据此可以推出\(\langle g | f\rangle=\langle f | g\rangle^{*}\)
- 厄米共轭就是对一个矩阵(算符)取共轭转置;
- 厄米算符是一种等于自己的厄米共轭的算符。
逆矩阵$$ (A B)^{-1}=B^{-1} A^{-1} $$酉矩阵(unitary matrix)$$A^{*}=A^{-1}$$Change of basis
对于矩阵(算符)\(\hat{A}\),可以用basis 1对应的矩阵\(A\)来表示,现在想用basis 2来表示(对应的矩阵为\(B\)),矩阵\(S\)是将base 1转换成basis 2的矩阵,那么矩阵\(B=S A S^{-1}\)
矩阵的对角化(Diagonalization)
\(\hat{A}\)是线性变换,是可观测量,是算符,如果用老的传统的基底表示这个算符就是矩阵\(A\),现在如果我们选取特征向量(特征函数)作为基底(对应于新的矩阵\(\Lambda\)),那么就是将这个旧矩阵\(A\)对角化。新的对角化后的矩阵可以表示为\(\Lambda =S^{-1}A S\),其推导如下$$A S=A\left[\begin{array}{llll} \mathbf{x}_{1} & \mathbf{x}_{2} & \cdots & \mathbf{x}_{\mathbf{n}} \end{array}\right]=\left[\begin{array}{llll} \lambda_{1} \mathbf{x}_{1} & \lambda_{2} \mathbf{x}_{2} & \cdots & \lambda_{\mathbf{n}} \mathbf{x}_{\mathbf{n}} \end{array}\right]=S\left[\begin{array}{cccc} \lambda_{1} & 0 & \cdots & 0 \\ 0 & \lambda_{2} & & 0 \\ \vdots & & \ddots & \vdots \\ 0 & \cdots & 0 & \lambda_{n} \end{array}\right]=S\Lambda$$
【希尔伯特空间】
- 平方可积函数的集合(即满足\(\displaystyle\int_{a}^{b}|f(x)|^{2} d x<\infty\))构成的一个矢量空间称为希尔伯特空间;
- 量子力学中的积分区间通常是负无穷到正无穷,这里\((a,b)\)是更一般的情形;
- 数学家称其为\(L^{2}(a, b)\);
- 量子力学中表示粒子状态的态矢量就是希尔伯特空间里的一个元素;
- 如果这两个函数都属于希尔伯特空间,那么它们的内积一定也属于该空间,依据为柯西-施瓦茨不等式$$\left|\displaystyle\int_{a}^{b} f(x)^{*} g(x) d x\right| \leq \sqrt{\displaystyle\int_{a}^{b}|f(x)|^{2} d x \int_{a}^{b}|g(x)|^{2} d x}$$
Linear algebra in Hilbert space
- 向量\(|\alpha\rangle\)对应于wave function的state \(\psi_{\alpha }(x)\)
- wave function是希尔伯特空间中的vector
- 内积\(\langle \beta \mid \alpha \rangle\)对应于\(\displaystyle\int_{-\infty}^{\infty} \psi_{\beta}^{*}(x) \psi_{\alpha}(x) d x\)
- 归一化\(\langle\alpha \mid \alpha\rangle=1\)对应于\(\displaystyle\int_{-\infty}^{\infty} \psi_{\alpha}^{*}(x) \psi_{\alpha}(x) d x=1\)
- 正交性\(\langle\alpha \mid \beta\rangle=0\)对应于\(\displaystyle\int_{\infty}^{\infty} \psi_{\alpha}^{*}(x) \psi_{\beta}(x)=0\)
- 完备性\(|\psi\rangle=\displaystyle\sum_{n=1}^{\infty} a_{n}\left|\psi_{n}\right\rangle\)
- 一组函数\(\left\{f_{n}(x)\right\}\)满足正交归一性,那么我们可以把每一项的系数摘出来\(c_{n}=\left\langle f_{n} | f\right\rangle\)
资料:
(1) 如何理解希尔伯特空间?—知乎
(2) 希尔伯特空—知乎
可观测量和厄米算符
可观测量
- 实数,\(\langle Q\rangle=\langle Q\rangle^{*}\)
- 存在一个统计分布,所以我们讨论的是其期望值\(\langle Q\rangle\)
- \(\langle Q\rangle=\langle\psi \mid \hat{Q} \psi\rangle=\langle\hat{Q} \psi \mid \psi\rangle\)
- \(\langle Q\rangle^{*}=\langle\psi \mid \hat{Q} \psi\rangle^{*}=\langle\hat{Q} \psi \mid \psi\rangle=\langle Q\rangle\)
- \(\hat{Q}\)是【厄米算符】(Hermitian),即从矩阵角度看,它和自己的厄米共轭矩阵相同,显然主对角线上的元素必须是实数。
- 可观测量由厄米算符表示,如果有一个可观测的物理量,那么在量子力学就有一个厄米算符与之对应。
- \(\langle f | \hat{Q}{g}\rangle=\langle\hat{Q} f | g\rangle\)对任意\( f(x) \)和\( g(x) \)都成立,反过来也可以推出\(\hat{Q}\)是厄米算符。
【定态】(Determinate States)
- \(\sigma_{Q}=0\),每次观测\(\hat{Q}\)都得到同样的值\( q\)或者写成\(\langle Q\rangle\),我们将这种状态称为determinate states;
- stationary state也是determinate states的一种,只是对stationary state而言\(\hat{Q}\)是\(\hat{H}\),这里我们讨论的determinate states的\(\hat{Q}\)是universal的。
- \(\sigma_{Q}=0\)也即\(\sigma_{Q}^{2}=\left\langle(\hat{Q}-\langle Q\rangle)^{2}\right\rangle=\left\langle\Psi \mid(\hat{Q}-q)^{2} \Psi\right\rangle=\langle(\hat{Q}-q) \Psi \mid(\hat{Q}-q) \Psi\rangle=0 \)
于是必有\( (\hat{Q}-q) \Psi=0\),即\(\hat{Q} \Psi=q \Psi\)。也就是说,我们重复测量波函数\(\Psi \)的物理量\( Q \),如果每次结果都一样为\( q\),那么称定态\( \Psi \)是\( \hat{Q} \)的本征函数(“特征向量”),\( q \)为对应的本征值(“特征值”)。
注:
(1) \( \langle Q\rangle=q\),\( \hat{Q}\)是一个厄米算符,那么它减去一个实常数\( \hat{Q}-q \)仍是厄米算符;
(2) 零(“零向量”)不是本征函数,不然都没意义了,但是零可以是本征值;
(3) 一个算符的所有本征值的集合叫作这个算符的【谱】;
(4) 一个本征值对应两个或多个线性无关的本征函数,这种情况叫作谱的【简并】(其实就是线性代数中的重复特征值的情况,比如自由粒子中的\( k\)取正或者负可以得到两个不同的eigenstates但是eigen energy是一样的)
(5) 可观察量,像位置,动量,角动量,和自旋,都是用作用于希尔伯特空间的自伴算符来代表,哈密顿算符(也属于厄米算符)所代表的哈密顿量是粒子的总能量,也一个可观察量。
本征函数即为物理上可观测量的定态,按谱(厄米算符特征值集合)的特点可以如下分类:
- 【分立谱】:本征函数处于希尔伯特空间中,并且构成了可以实现的态。举例:一维无限深势阱、谐振子;
- 【连续谱】:本征函数不可归一化,不能代表实际可能的波函数。但是这些本征函数的线性组合可能是可以实现的波函数,即是可以归一化的。举例:自由粒子;
- 【分立+连续谱】:举例:有限深势阱,当\( E \)与势阱相交,那么会有分立本征值,如果高于势阱,那么是谱是连续的。\(\delta \)势阱也类似。
分立谱
- 特征值都是实数(非常重要)
已经有\(\hat{Q} f=q f \),或者写成\(\hat{Q}| f\rangle=q| f\rangle\),两边取共轭转置,得到\(\langle\hat{Q} f|=q^{*}\langle f|\)。根据厄米算符的性质有\(\langle f | \hat{Q} f\rangle=\langle\hat{Q} f | f\rangle \),因此\( q\langle f | f\rangle=q^{*}\langle f | f\rangle \),即\(q=q^{*}\); - 属于不同本征值的本征函数相互正交 \( \langle f | g\rangle=0 \)
\(\hat{Q} f=q f, \quad \hat{Q} g=q^{\prime} g \quad \Rightarrow \quad \langle f | \hat{Q} g\rangle=\langle\hat{Q} f | g\rangle \quad \Rightarrow \quad q^{\prime}\langle f | g\rangle=q^{*}\langle f | g\rangle\)成立的两种条件- \(q^{\prime}=q^{*}\),即相同特征值对应不同特征向量,也就是简并态,这时我们可以采用【Gram-Schmidt 正交化】使不同特征向量相互正交,也就是说,如果一个本征值有两个线性无关的本征函数(简并),那么它们张成的空间一定可以用该空间中两个正交归一的向量去张成;另外,这个空间于其他本征函数的空间垂直;
- 如果两个特征值不同,那么只能是\( \langle f | g\rangle=0 \);
- Eigenstates of hermitian operators are complete (严格来说,在本课程范围内是一种默认的假设)
公理:可观测量算符的本征函数是完备的:(在希尔伯特空间中)任何函数都可以用它们的线性叠加来表达。
\(\widehat{Q}|\psi\rangle=q|\psi\rangle\)得到a spectrum of eigenstates \(\left\{\left|\psi_{n}\right\rangle\right\}\)以及a spectrum of eigenvalues\(\left\{q_{n}\right\}\)。The set of vectors \(\left\{\left|\psi_{n}\right\rangle\right\}\) span the complete space that you're working with. 也就是说任意状态都可以表示为基底向量的线性组合\(|f\rangle=\displaystyle\sum_{n=1}^{\infty} a_{n}\left|\psi_{n}\right\rangle\),其中\(a_{n}=\left\langle\psi_{n} \mid f\right\rangle\) (傅里叶技巧——克罗内克\( \delta \))
思考:前面我们研究谐振子或者一维无限深势阱的时候,都有\(\displaystyle\int \psi_{m}^{*}(x) \psi_{n}(x) d x=\delta_{m n} \),即哈密顿算符的不同的本征函数之间相互正交。其实这种性质不是哈密顿算符及其本征函数所特有的,对于任何一个可观测量的算符,其线性无关的本征函数之间必定相互正交,或者说不同本征值对应的本征函数之间相互正交。这在笔记线性代数2中也有讲到,对称矩阵的特征值只能是实数,而反对称矩阵的特征值是零或者纯虚数,而且对称矩阵不同特征值对应的特征向量必定正交;推广到这里的厄米共轭矩阵(厄米算符)也是一样的。
连续谱
- 厄米算符的谱是连续的,由于内积可能不存在(无穷大/无穷小),其本征函数是不可归一化的。
- 动量算符的本征值和本征函数(time-independent),根据\(\displaystyle\frac{\hbar}{i} \frac{d}{d x} f_{p}(x)=p f_{p}(x)\)求得本征函数\(f_p(x)=e^{ipx/ \hbar}\),无论\( p\)是实数还是虚数,本征函数都不是平方可积的,也就是动量算符在希尔伯特空间中没有本征函数。但是如果限定本征值\(p \)为实数,那么可以得到一个人为的“正交归一性”。对两个不同本征值的本征函数做内积有(取\(A=1 / \sqrt{2 \pi \hbar}\))
\(\langle f_{p^{\prime}} \mid f_{p}\rangle=\displaystyle\int_{-\infty}^{\infty} f_{p^{\prime}}^{*}(x) f_{p}(x) d x=|A|^{2}\displaystyle \int_{-\infty}^{\infty} e^{i\left(p-p^{\prime}\right) x / \hbar} d x=|A|^{2} 2 \pi \hbar \delta\left(p-p^{\prime}\right)e=\delta(p-p^{\prime})\)
这就是【狄拉克正交归一性】 - 傅里叶技巧——狄拉克\( \delta \)
$$\begin{array}{l} f(x)=\displaystyle\int_{-\infty}^{\infty} c(p) f_{p}(x) d p=\displaystyle\frac{1}{\sqrt{2 \pi \hbar}} \int_{-\infty}^{\infty} c(p) e^{i p x / \hbar} d p \\ \left\langle f_{p^{\prime}} | f\right\rangle=\displaystyle\int_{-\infty}^{\infty} c(p)\left\langle f_{p^{\prime}} | f_{p}\right\rangle d p=\int_{-\infty}^{\infty} c(p) \delta\left(p-p^{\prime}\right) d p=c\left(p^{\prime}\right) \\ \left\langle f_{p^{\prime}} | f_{p}\right\rangle=\delta\left(p-p^{\prime}\right)\end{array}$$注意\( p \)和\(p^{\prime} \)都是特征值,而且是实数域上连续可取,所以\( c( p) \)和\( c( p^{\prime}) \)都是函数了。 - 对于time-dependent的情况,其实就是在指数项上加上和能量有关的项,\(\hat{p}|\psi_{p}\rangle=p|\psi_{p}\rangle\),结果类似\(|\psi_{p}\rangle=e^{-i(p x / \hbar+p^2t/2m)}\),这个不可归一化,对应的本征值为\(p\)。
例题与思考
求坐标算符的本征函数与本征值$$x g_{y}(x)=y g_{y}(x) $$由于\( x \)是一个坐标算符,一直在变化,但是等式一直相等。从矩阵角度,我们很容易想到如果本征函数\( g_{y}(x) \)是个“零向量”,那么无论\( x \)怎么取值都成立。现在排除这种特殊情况,现在我们要思考\( y\)是一个常数,坐标算符\(x \)的作用其实就是直接乘到\( g_{y}(x)\)上,也就是\((x-y)g_{y}(x)=0 \)。要想让它成立,我们有两个选择
(1) 一是当\(x=y \)时,\( g_{y}(x)=g_{y}(y)=A \),其中\( A\)为常数;
(2) 二是当\(x\neq y \)时,必须有\( g_{y}(x)=0 \);而我们已经说明了\( g_{y}(x) \)这里不是零向量,所以\( A\neq 0\)。显然\( g_{y}(x)=A \delta(x-y) \)。
思考:其实这里可以这样看,这里的\( y\)是一个常数,一个常数乘以\(g_{y}(x) \)得到的是\(g_{y}(x) \)线性放大的结果,而\( x\)乘以\(g_{y}(x) \) 按道理每个函数值都发生了变化,而且不是线性的。唯一的可能是当\( x\neq y \)时,函数值都为零,这样管你怎么变换,两边都相等;而当\( x=y \)时,函数值不等于零。
对于不同的\( y\)值,显然\( g_{y}(x)=A \delta(x-y) \)函数相互正交(我们取\(A \)=1),而且变化\( y \)值,我们可以得到从横轴的负无穷处移动到正无穷处的无限个“单位冲激函数”。对于任意函数\( f(x) \),根据本征函数集完备性的特点,\( f(x) \)可以表示为所有本征函数的线性组合:(组合系数就是函数自己)$$f(x)=\int_{-\infty}^{\infty} c(y) g_{y}(x) d y=\int_{-\infty}^{\infty} c(y) \delta(x-y) d y=c(x)$$即每一个本征函数前面的系数就是特征值所对应的的函数值。即狄拉克\( \delta \)函数移动到某一处,那么该处对应的\( f\)函数值就是\( c(x)\)。\( f(x)\)可以看作是一堆连续的狄拉克\( \delta \)函数的线性组合的积分,线性组合的系数构建成了\( f(x) \)或者说\( c(x) \)。
广义统计诠释
【波函数坍塌】:描述粒子的波函数是多个本征态(本征函数/向量)的线性组合,测量之后,波函数"坍塌"于相应的本征态。这也是量子力学的假设之一,不需要纠结为什么是这样,反正满足已有的实验现象。
分立谱
- \(\hat{Q}|\psi\rangle=q|\psi\rangle\)对应于本征态\(\left\{\left|\psi_{n}\right\rangle\right\}\)以及本征值\(\left\{q_{n}\right\}\)
- 任意波函数可以表示为本征态函数的线性组合\(|f\rangle=\sum_{n} a_{n}\left|\psi_{n}\right\rangle\),其中线性组合的系数\(a_{i}=\left\langle\psi_{i} \mid f\right\rangle\)
- 测量可观测量\(Q\)得到的结果\(q_{n} \in\left\{q_{i}\right\}\),其对应的概率为\(P\left(q_{n}\right)=\left|a_{n}\right|^{2}\)
- 归一化:\(\langle f \mid f\rangle=\left.\left(\sum_{n} a_{n}^{*}\left\langle\psi_{n}\right)\right)\left(\sum_{m} a_{m} \mid \psi_{m}\right)\right)=\sum_{n} a_{n}^{*} a_{n}=1\)
- 期望:\(\langle Q\rangle=\langle f \mid \hat{Q} f\rangle=\left(\sum_{n} a_{n}^{*}\left\langle\psi_{n}\right|\right)\left(\sum_{m} a_{m} \hat{Q}\left|\psi_{m}\right\rangle\right)=\sum_{n} \sum_{m} a_{n}^{*} a_{m} q\left\langle\psi_{n} \mid \psi_{m}\right\rangle=\sum_{n}\left|a_{n}\right|^{2} a_{n}\)
连续谱
- 连续的\(q\)对应的本征态\(|\psi(q)\rangle\),这里的\(q\)是任意动力学变量;
- 任意波函数可以表示为\(|f\rangle=\displaystyle\int d q f(q)|\psi(q)\rangle\),其中\(f(q)=\langle\psi(q) \mid f\rangle\)
- 对于具有连续谱的情况,这类似描述连续随机变量的概率密度函数,单独挑出一个具体数值谈概率是没有意义的,因为肯定是零,所以只能说某一段区间内的概率,这样才有“面积”。
- 测量可观测量\(Q\)得到的结果在\(q_{0}<q<q_{0}+d q\)区间的概率为\(|f(q)|^{2} d q\)
- 归一化:\(\int|f(a)|^{2} d q=1\)
- 期望:$$\begin{aligned} \langle Q\rangle &=\left(\int_{-\infty}^{\infty} d q_{1} f^{*}\left(q_{1}\right)\left\langle\varphi\left(q_{1}\right)\right|\left(\int_{-\infty}^{\infty} d q_{2} f\left(q_{2}\right) \hat{Q}\left|\psi\left(q_{2}\right)\right\rangle\right)\right. \\ &=\int_{-\infty}^{\infty} d q_{1} \int_{-\infty}^{\infty} d q_{2} F^{*}\left(q_{1}\right) f\left(q_{2}\right) q_{2}\left\langle\psi\left(q_{1}\right) \mid \psi\left(q_{2}\right)\right\rangle\\ &=\int_{-\infty}^{\infty} d q_{1} f^{*}\left(q_{1}\right) f\left(q_{1}\right) q_{1}\\ &=\int_{-\infty}^{\infty}|f(q)| q d q \end{aligned}$$
例子1:量测\( \hat{x} \)得到的是特征值\( y \)。波函数就会坍塌为$$g_{y}(x)=\delta (x-y)$$显然有$$c(y)=\left\langle g_{y} | \Psi\right\rangle=\int_{-\infty}^{\infty} \delta(x-y) \Psi(x, t) d x=\Psi(y, t)$$那么本征值\(y \)处于某段范围\((y, z+d y) \)的几率为\(|c(y)|^{2} d y=|\Psi(y, t)|^{2} d y \),这就是先前的统计诠释。
例子2:量测动量\( \hat{p} \)得到的是动量的特征值\( p \),我们在“可观测量和厄米算符—连续谱)”章节已经计算过,对应的是特征向量为(波函数坍塌到)$$f_{p}(x)=\frac{1}{\sqrt{2 \pi \hbar}}e^{i p x / h}$$所以(下面的公式,左矢\( f_{p}\)作用的时候要取其共轭转置,所以有负号)$$c(p)=\left\langle f_{p} | \psi\right\rangle=\frac{1}{\sqrt{2 \pi \hbar}} \int_{-\infty}^{\infty} e^{-i p x / \hbar} \Psi(x, t) d x$$所以量到是\((p, p+d p)\)的几率为$$P(p, p+d p)=|c(p) |^{2} d p$$我们可以命名为动量空间波函数,记为\(\phi(p, t) =c(p,t)\),其实就是坐标空间波函数\( \Phi(x, t)\)的傅里叶变换。$$\begin{array}{l} \Phi(p)=\displaystyle\frac{1}{\sqrt{2 \pi \hbar}} \displaystyle\int_{-\infty}^{\infty} e^{-i p x / \hbar} \Psi(x) d x \\ \psi(x)=\displaystyle\frac{1}{\sqrt{2 \pi \hbar}} \displaystyle\int_{-\infty}^{\infty} e^{i p x / \hbar} \phi(p) d p \end{array}$$
信号处理的,time domain和frequency domain的关系,类似这里的坐标空间和动量空间,互为傅里叶变换和逆变换。两种表示方法是等价的,描述的是同一个东西。我们先前默认用\( x\)的表达式去表示动量算符,其实反过来也可以用动量算来表示位置算符。不同的domain,表现出的特点是不同的,也就是说有些信息在这个domain能够很好展示,很容易看出来,但是在另一个domain却不是这样,但是另一个domain中可以很容易观察到先前那个domain中不容易观察到的东西,这就是两个domain都存在的意义。比如我们要知道动量在某个区间的概率,那么显然用动量空间函数更容易。
实验上(特别是量子力学实验)很少测量\( x\),不关心这种问题。比如氢原子光谱,量测的是能量(对应不同的轨道),不是位置。