선형대수와 군 1.1 1)

Posted Apr 18, 2024 Updated Apr 20, 2024

By Charlie Park 13 min read

1.1 Matrix

집합 $F$가 실수 전체의 집합 $\mathbb{R}$, 혹은 복소수 전체의 집합 $\mathbb{C}$이고, 모든 $i=1, \cdots, m$과 $j=1, \cdots,n$에 대하여 $a_{ij} \in F$일 때,

\[A = \begin{pmatrix} a_{11} & a_{12} & a_{13} & \cdots & a_{1n}\\ a_{21} & a_{22} & a_{23} & \cdots & a_{2n}\\ \vdots & \vdots & \vdots & \ddots & \vdots\\ a_{m1} & a_{m2} & a_{m3} & \cdots & a_{mn}\\ \end{pmatrix}\]

을 $F$ 위의 $m \times n$ 행렬 ($m \times n$ matrix over $F$)이라고 부른다.

여기서 주의할 것. 행렬은 실수 전체의 집합 또는 복소수 전체의 집합과 같이 어떤 집합 위에서 정의된다. 행렬은 가로, 세로 index (행과 열에 대한 index)를 사용하여 정의된다.

$m \times n$ 행렬 $A$를 간단히는 아래와 같이 나타낼 수 있다.

\[A = (a_{ij})_{m \times n} = (a_{ij})\]

이때 $a_{ij}$를 행렬 $A$의 $(i, j)$ 좌표(coordinate) 혹은 성분(component)라고 부르고,

$A$의 $i$번째 행(row)을 $[A]_i$, $A$의 $j$번째 열(column)을 $[A]^j$로 표기한다.

두 $m \times n$ 행렬 $A=(a_{ij})$와 $B=(b_{ij})$가 같다는 것은 모든 $i,j$에 대하여 $a_{ij}=b_{ij}$라는 뜻이다.

$F$ 위의 $m \times n$ 행렬 전체의 집합은 $\mathfrak{M}_{m,n}(F)$로 표기한다.

행렬의 동치를 정의하고 행렬 전체의 집합을 어떻게 표현할지 정함.

두 $m \times n$ 행렬 $A=(a_{ij})$와 $B=(b_{ij})$의 덧셈을

\[A + B = (a_{ij} + b_{ij})\]

로 정의한다 (즉, $A+B$의 $(i, j)$ 좌표가 $a_{ij} + b_{ij}$라는 뜻).

$m \times n$ 행렬 $A=(a_{ij})$와 scalar $c \in F$의 상수곱(scalar multiplication)은

\[cA=(ca_{ij})\]

로 정의한다. 즉, 행렬의 덧셈과 상수곱은 자연스럽게 componentwise 정의된다.

size가 동일한 두 행렬 간의 덧셈과, 행렬과 scalar 간의 scalar 곱을 정의. 이는 componentwise로 자연스럽게 정의된다.

행렬곱은 덜 자연스럽게 정의된다.

Size가 $(m \times n)$인 행렬 $A=(a_{ij})$와 size가 $(n \times k)$인 행렬 $B=(b_{jk})$가 주어졌을 때, $m \times r$ 행렬 $AB$를

\[AB=(c_{ik}), \text{where}\ \sum_{j=1}^{n}{a_{ij}b_{jk}}\]

로 정의한다. 따라서 $c_{ik}$는 $A$의 $i$th row $[A]_i$와 $B$의 $k$th column $[B]^k$의 내적이라고 생각할 수 있다. (이 때, 내적은 ‘보통 내적’을 말한다. 보통 내적 : $\mathbb{R}^n$에서는 $\mathbb{R}^n$의 dot product). 이때, 행렬 곱은 size가 행렬 곱이 가능하도록 주어져야 한다.

행렬 곱을 왜 부자연스럽게 정의하는지 이해하는 것이 1장의 목표이며, 행렬과 선형사상이 같은 것과도 연결된다

행렬 곱 정의 및 선형사상 언급

영행렬(zero matrix) $0$은 모든 좌표가 0인 행렬을 뜻한다.

$n$차 항등행렬(identiy matrix) $I_n=I$는 $(i,j)$ 좌표가 $\delta_{ij}$인 $n \times n$ 정사각행렬을 나타낸다.

여기서 $\delta_{ij}$는 Kronecker’s delta이다. $\delta_{ij} = \begin{cases} 0\quad \text{if}\ i \neq j
1\quad \text{if}\ i = j \end{cases}$

또한, $m \times n$ 행렬 $A, B$에 대하여,

\[-A = (-1)A,\quad A-B=A+(-B)\]

로 표기한다.

Zero matrix, identity matrix를 정의함으로써 가장 기초적인 도구는 모두 등장했다.

관찰 1.1.1

행렬 $A, B, C$ 와 scalar $r, s \in F$ 에 대하여, 연산들이 장 정의되어 있으면 (즉, 행렬들의 size가 연산이 가능하도록 주어져 있으면) 아래와 같은 규칙들이 성립한다.

$(A + B) + C = A + (B + C)$ (덧셈의 결합법칙)
$A + B = B + A$ (덧셈의 교환법칙)
$A + 0 = A$ (덧셈의 항등원)
$A - A = 0$ (덧셈의 역원)
$(r + s) A = rA + sA$ (분배법칙)
$r(A+B) = rA + rB$ (분배법칙)
$r(sA) = (rs)A$
$1A = A$
$(AB)C = A(BC)$ (곱셈의 결합법칙)
$AI = A, IA = A$ (곱셈의 항등원)
$(A+B)C = AC + BC, A(B+C) = AB + AC$ (분배법칙)
$(rA)B = r(AB) = A(rB)$

이 규칙들이 성립하는지 앞서 정의한 것들을 사용해서 증명해보자

우선 1 ~ 8번은 componentwise로 표현하면 자명함을 쉽게 보일 수 있다.

1.$(A + B) + C = A + (B + C)$ (덧셈의 결합법칙)

행렬의 덧셈은 componentwise 정의되었고, 각각의 component가 덧셈의 결합법칙을 만족하므로 행렬의 덧셈 역시 덧셈의 결합법칙을 만족해야한다.

2.$A + B = B + A$ (덧셈의 교환법칙)

행렬의 덧셈은 componentwise 정의되었고, 각각의 component가 덧셈의 교환법칙을 만족하므로 행렬의 덧셈 역시 덧셈의 교환법칙을 만족해야한다.

3.$A + 0 = A$ (덧셈의 항등원)

행렬의 덧셈은 componentwise 정의되었고, 각각의 component가 덧셈의 항등원 0을 가진다. 모든 component가 zero인 zero vector $0$은 덧셈의 항렬을 component로 가지고 있고, 따라서 $0$은 행렬 덧셈의 항등원이다.

4.$A - A = 0$ (덧셈의 역원)

행렬의 덧셈은 componentwise 정의되었고, 행렬 $A=(a_{ij})$의 각각의 component $a_{ij}$가 덧셈의 역원 $-a_{ij}$를 가진다. $(-a_{ij}) = (-1 * a_{ij}) = -1A = -A$ 이므로, $-A$는 행렬 $A$의 덧셈의 역원이다.

5.$(r + s) A = rA + sA$ (분배법칙)

좌변 $(r + s) A$는 scalar 곱의 정의에 따라 $(r + s) A = ((r+s)a_{ij})$이다. 덧셈에 대한 곱셈의 분배법칙에 따라, $((r+s)a_{ij})=(ra_{ij}+sa_{ij})$이고 이는 다시 행렬 덧셈과 scalar 곱의 정의에 따라 $(ra_{ij}+sa_{ij}) = rA + sA$이다. 이는 우변과 같으므로 이 규칙은 성립한다. → scalar 덧셈의 scalar 곱에 대한 분배법칙

6.$r(A+B) = rA + rB$ (분배법칙)

좌변 $r(A + B)$는 행렬 덧셈의 정의에 따라 $r(A + B) = r(a_{ij} + b_{ij})$이다. 이는 scalar 곱의 정의에 따라 $r(a_{ij} + b_{ij}) = (r(a_{ij} + b_{ij}))$이다. 덧셈에 대한 곱셈의 분배 법칙에 따라, $(r(a_{ij} + b_{ij})) = (ra_{ij} + rb_{ij})$이다. 행렬 덧셈과 scalar 곱의 정의에 따라 $(ra_{ij} + rb_{ij}) = (ra_{ij})+(rb_{ij}) = r(a_{ij}) + r(b_{ij}) = rA + rB$이다. 이는 우변과 같으므로 이 규칙은 성립한다. → 행렬 덧셈의 scalar 곱에 대한 분배법칙

7.$r(sA) = (rs)A$

scalar 곱의 정의에 따라, $r(sA) = r(s(a_{ij})) = r(sa_{ij}) = (rsa_{ij}) = rs(a_{ij}) = (rs)A$이다.

8.$1A = A$

scalar 곱의 정의에 따라, $1A = 1(a_{ij}) = (1a_{ij}) = (a_{ij}) = A$

9.$(AB)C = A(BC)$ (곱셈의 결합법칙)

이를 증명하기 위해서는, 양변의 component가 같음을 보이면 된다.

$A = (a_{ij}), B = (b_{jk}), C = (c_{kl})$이고, 행렬 $A$의 $(i,j)$좌표를 $[A]_{ij}$로 표기하자.

좌변의 $(i,l)$ 좌표) $\lbrack (AB)C \rbrack_{il} = \sum_{k}\lbrack AB \rbrack_{ik}c_{kl} = \sum_{k}(\sum_{j}{a_{ij}b_{jk})c_{kl}} = \sum_{k,j}({a_{ij}b_{jk})c_{kl}}$

우변의 $(i,l)$ 좌표)

$\lbrack A(BC) \rbrack_{il} = \sum_{j}a_{ij}\lbrack BC \rbrack_{kl} = \sum_{j}a_{ij}(\sum_{k}{b_{jk}c_{kl})} = \sum_{j,k}{a_{ij}(b_{jk}c_{kl}})$

곱셈의 결합법칙에 의해 좌변과 우변의 sigma 내부 항은 서로 $a_{ij}b_{jk}c_{kl}$로 같다. 이를 다시 $d_{ijkl}$이라고 하자. 그러면 좌변과 우변의 $(i,l)$ 좌표는 아래처럼 다시 적을 수 있다

좌변) $\lbrack (AB)C \rbrack_{il} = \sum_{k,j}d_{ijkl}$ 우변) $\lbrack A(BC) \rbrack_{il} = \sum_{j,k}d_{ijkl}$

좌변과 우변의 $(j, k)$ 좌표는 $i, l$ index와 무관하다. 따라서 $d_{ijkl}$에서 $i,l$ index를 분리한다.

좌변) $\lbrack (AB)C \rbrack_{il} = \sum_{k,j}d_{ijkl} = \lbrack \sum_{k,j}d_{jk} \rbrack_{il}$ 우변) $\lbrack A(BC) \rbrack_{il} = \sum_{j,k}d_{ijkl} = \lbrack \sum_{j,k}d_{jk} \rbrack_{il}$

따라서 이제 우리는 $\sum_{k}\sum_{j}d_{jk} = \sum_{j}\sum_{k}d_{jk}$ 만을 증명하면 된다. 이는 아주 쉽게 자명함을 보일 수 있다. 행렬에서 행 방향으로 더한 후 열 방향으로 더하든, 열 방향으로 더한 후 행 방향으로 더하든, 두 합은 모두 행렬의 모든 원소의 합이 된다.

따라서 $\lbrack (AB)C \rbrack_{il} = \lbrack A(BC) \rbrack_{il}$이고, $(\lbrack (AB)C \rbrack_{il}) = (\lbrack A(BC) \rbrack_{il})$ 이므로, $(AB)C = A(BC)$이다.

10.$AI = A, IA = A$ (곱셈의 항등원)

$\lbrack AI \rbrack_{ik} = \sum_{j}a_{ij}\delta_{jk}$이다. Kronecker’s Delta의 정의에 따라, $\delta_{jk}$는 $j=k$일 때 1, $j \neq k$일때 0이다. 이에, $a_{ij}\delta_{jk}$는 $j=k$일 때 $a_{ij}$, $j \neq k$일때 0이다. 따라서, $\lbrack AI \rbrack_{ik} = \sum_{j}a_{ij}\delta_{jk} = a_{ik}$이므로 $AI = (\lbrack AI \rbrack_{ik})=(a_{ik})=A$이다

$\lbrack IA \rbrack_{ik} = \sum_{j}\delta_{ij}a_{jk}$이다. Kronecker’s Delta의 정의에 따라, $\delta_{ij}$는 $i=j$일 때 1, $i \neq j$일때 0이다. 이에, $\delta_{ij}a_{jk}$는 $i=j$일 때 $a_{jk}$, $i \neq j$일때 0이다. 따라서, $\lbrack IA \rbrack_{ik} = \sum_{j}\delta_{ij}a_{jk} = a_{ik}$이므로 $IA = (\lbrack IA \rbrack_{ik})=(a_{ik})=A$이다

11.$(A+B)C = AC + BC, A(B+C) = AB + AC$ (분배법칙)

$A = (a_{ij}), B = (b_{ij}), C = (c_{jk})$이고, 행렬 $A$의 $(i,j)$좌표를 $\lbrack A \rbrack_{ij}$로 표기하자.

$\lbrack (A + B)C \rbrack_{ik} = \lbrack (a_{ij} + b_{ij})C \rbrack_{ik} = \sum_{j}(a_{ij} + b_{ij})c_{jk}$이다.

덧셈의 곱셈에 대한 분배법칙에 따라, $\sum_{j}(a_{ij} + b_{ij})c_{jk} = \sum_{j}(a_{ij}c_{jk} + b_{ij}c_{jk}) = \sum_{j}a_{ij}c_{jk} + \sum_{j}b_{ij}c_{jk} = \lbrack AC \rbrack_{ik} + \lbrack BC \rbrack_{ik}$

따라서, $(A+B)C = AC+BC$이다.

$\lbrack A(B+C) \rbrack_{ik} = \lbrack A(b_{jk}+c_{jk}) \rbrack_{ik} = \sum_{j}a_{ij}(b_{ij} + c_{jk})$이다.

덧셈의 곱셈에 대한 분배법칙에 따라, $\sum_{j}a_{ij}(b_{ij} + c_{jk}) = \sum_{j}a_{ij}b_{ij} + a_{ij}c_{jk} = \sum_{j}a_{ij}b_{ij} + \sum_{j} a_{ij}c_{jk} = \lbrack AB \rbrack_{ik} + \lbrack AC \rbrack_{ik}$

따라서, $A(B + C) = AB + AC$이다.

12.$(rA)B = r(AB) = A(rB)$

$\lbrack (rA)B \rbrack_{ik} = \sum_{j}{(ra_{ij})b_{jk}} = \sum_{j}{ra_{ij}b_{jk}}$

$r(AB) = r\sum_{j}{a_{ij}b_{jk}} = \sum_{j}{ra_{ij}b_{jk}}$

$A(rB) = \sum_{j}{a_{ij}(rb_{jk})} = \sum_{j}{ra_{ij}b_{jk}}$

정의를 바탕으로 각 법칙을 component를 사용해 잘 표현하다보면 증명 가능

Math, Linear Algebra

This post is licensed under CC BY 4.0 by the author.

1.1 Matrix

Trending Tags