golang 数组/切片/slice

golang 数组 array, 切片, slice

Go 的切片类型为处理同类型数据序列提供一个方便而高效的方式。切片有些类似于其他语言中的数组, 但是有一些不同寻常的特性。

Go的(Slice)切片是在(Array)数组之上的抽象数据类型, 因此在了解切片之前必须要先理解数组。

数组, array

声明一个数组

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
// var identifier [len]type
var foo [5]int

// 声明时没有指定数组的初始化值, 因此所有的元素都会被自动初始化为默认值 0。

//Go 语言中的数组是值类型，因此还可以用 new 来创建
bar := new([5]int)
// new 返回类型的指针，因此 foo bar 的区别在于: foo 的类型为 [5]int，bar 的类型为 *[5]int。

var a [4]int
a[0] = 1
i := a[0]

数组的长度在声明它的时候就必须给定,并且之后不会再改变。可以说, 数组的长度是其类型的一部分。比如, [1]string 和 [2]string 就是两个不同的数组类型。数组可以以常规的索引方式访问,表达式 s[n] 访问数组的第 n 个元素。

golang array 特点:

golang中的数组是值类型, 也就是说, 如果你将一个数组赋值给另外一个数组, 那么, 实际上就是整个数组拷贝了一份
如果 golang 中的数组作为函数的参数, 那么实际传递的参数是一份数组的拷贝, 而不是数组的指针
array 的长度也是 Type 的一部分, 这样就说明 [10]int 和 [20]int 是不一样的。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
foo:= [5] int {1,2,3,4,5}
// 长度为5的数组,其元素值依次为: 1,2,3,4,5
[5] int {1,2} 
// 长度为5的数组,其元素值依次为: 1,2,0,0,0 。在初始化时没有指定初值的元素将会赋值为其元素类型int的默认值0,string的默认值是""
[...] int {1,2,3,4,5} 
// 长度为5的数组,其长度是根据初始化时指定的元素个数决定的
[5] int { 2:1,3:2,4:3} 
// 长度为5的数组,key:value,其元素值依次为: 0,0,1,2,3。在初始化时指定了2,3,4索引中对应的值: 1,2,3
[...] int {2:1,4:3} 
// 长度为5的数组,起元素值依次为: 0,0,1,0,3。由于指定了最大索引4对应的值3,根据初始化的元素个数确定其长度为5

1
2
3
4
// 遍历
for i, value := range arrayOrSlice {
    log.Printf("%v: %v", i, value)
}

切片/Slices

slice 切片类型是一个引用类型, 是一个动态的指向数组切片的指针。 slice 是一个不定长的, 总是指向底层的数组 array 的数据结构。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
// 切片声明需要指定元素组成的类型，但不需要指定存储元素的数量
// 在切片声明后，会被初始化为 nil(零值)，表示暂不存在的切片。如下:
// []int{} 空切片指的是底层数组没有存储元素
// var nums []int nil切片指的是底层数组是指向nil，没有申请内存空间的，在append的时候申请
var foo []int          // 创建slice, 并初始化
foo := []int{}        // 一个空的切片
sl := make([]int,10)  // 创建有10个元素的 slice
sl := []int{1,2,3}    // 创建有初始化元素的slice

len(sl)
cap(sl)

通过内置函数 `append(slice []Type,elems …Type)` 追加元素

// 将 arr 中从下标 startIndex 到 endIndex-1 下的元素创建为一个新的切片。
s := arr[startIndex:endIndex] 
// 默认 endIndex 时将表示一直到arr的最后一个元素。
s := arr[startIndex:] 

初始化切片 s，s 是数组 arr 的引用

1
s := arr[:] 

清空 slice

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15

func SliceClear(s *[]interface{}) {
    *s = append([]interface{}{})
}

/*
 * 清空Slice,传入的slice对象地址不变。
 * params:
 *   s: slice对象指针,类型为*[]interface{}
 * return:
 *   无
 */
func SliceClear2(s *[]interface{}) {
    *s = (*s)[0:0]
}

0 ~ index

1
dir1 := path[:sepIndex]

index ~ end

1
dir1 := path[:sepIndex]

Full Slice Expression, 后续的 append() 操作将会导致重新分配内存

https://coolshell.cn/articles/21128.html

1
dir1 := path[:sepIndex:sepIndex]

:分割操作符

Go 的数组是值语义。一个数组变量表示整个数组, 它不是指向第一个元素的指针 (不像 C 语言的数组) 。当一个数组变量被赋值或者被传递的时候,实际上会复制整个数组。 (为了避免复制数组,你可以传递一个指向数组的指针,但是数组指针并不是数组。) 可以将数组看作一个特殊的struct,结构的字段名对应数组的索引,同时成员的数目固定。

数组的字面值像这样:

b := [2]string{“Penn”, “Teller”}

当然,也可以让编译器统计数组字面值中元素的数目:

1
b := [...]string{"Penn", "Teller"}

这两种写法, b 都是对应 [2]string 类型。

切片 Slices

数组的长度不可改变,在特定场景中这样的集合就不太适用,Go中提供了一种灵活,功能强悍的内置类型Slices切片,与数组相比切片的长度是不固定的,可以追加元素,在追加时可能使切片的容量增大。切片中有两个概念: 一是len长度,二是cap容量,长度是指已经被赋过值的最大下标+1,可通过内置函数len()获得。容量是指切片目前可容纳的最多元素个数,可通过内置函数cap()获得。切片是引用类型,因此在当传递切片时将引用同一指针,修改值将会影响其他的对象。

初始化

切片可以通过数组来初始化,也可以通过内置函数make()初始化 .初始化时len=cap,在追加元素时如果容量cap不足时将按len的2倍扩容查看示例代码,在线运行示例代码

s :=[] int {1,2,3 }

直接初始化切片,[]表示是切片类型,{1,2,3}初始化值依次是1,2,3.其cap=len=3

s := arr[:]

初始化切片s,是数组arr的引用

s := arr[startIndex:endIndex]

将arr中从下标startIndex到endIndex-1 下的元素创建为一个新的切片

s := arr[startIndex:]

缺省endIndex时将表示一直到arr的最后一个元素

s := arr[:endIndex]

缺省startIndex时将表示从arr的第一个元素开始

s1 := s[startIndex:endIndex]

通过切片s初始化切片s1

s :=make([]int,len,cap)

通过内置函数make()初始化切片s,[]int 标识为其元素类型为int的切片

赋值与使用

切片是引用类型,在使用时需要注意其操作。查看示例代码 ,在线运行示例代码切片可以通过内置函数append(slice []Type,elems …Type)追加元素,elems可以是一排type类型的数据,也可以是slice,因为追加的一个一个的元素,因此如果将一个slice追加到另一个slice中需要带上”…",这样才能表示是将slice中的元素依次追加到另一个slice中。另外在通过下标访问元素时下标不能超过len大小,如同数组的下标不能超出len范围一样。

s :=append(s,1,2,3,4)

s :=append(s,s1…)

切片

数组虽然有适用它们的地方,但是数组不够灵活,因此在Go代码中数组使用的并不多。但是,切片则使用得相当广泛。切片基于数组构建,但是提供更强的功能和便利。

切片类型的写法是 []T , T 是切片元素的类型。和数组不同的是,切片类型并没有给定固定的长度。

切片的字面值和数组字面值很像,不过切片没有指定元素个数: letters := []string{“a”, “b”, “c”, “d”}

切片可以使用内置函数 make 创建,函数签名为: func make([]T, len, cap) []T

其中T代表被创建的切片元素的类型。函数 make 接受一个类型、一个长度和一个可选的容量参数。调用 make 时,内部会分配一个数组,然后返回数组对应的切片。

var s []byte

s = make([]byte, 5, 5)

// s == []byte{0, 0, 0, 0, 0}

当容量参数被忽略时,它默认为指定的长度。下面是简洁的写法:

s := make([]byte, 5)

可以使用内置函数 len 和 cap 获取切片的长度和容量信息。

len(s) == 5

cap(s) == 5

接下来的两个小节将讨论长度和容量之间的关系。

切片的零值为 nil 。对于切片的零值, len 和 cap 都将返回0。

切片也可以基于现有的切片或数组生成。切分的范围由两个由冒号分割的索引对应的半开区间指定。例如,表达式 b[1:4] 创建的切片引用数组 b 的第1到3个元素空间 (对应切片的索引为0到2) 。

b := []byte{‘g’, ‘o’, ‘l’, ‘a’, ‘n’, ‘g’}

// b[1:4] == []byte{‘o’, ‘l’, ‘a’}, sharing the same storage as b

切片的开始和结束的索引都是可选的；它们分别默认为零和数组的长度。

// b[:2] == []byte{‘g’, ‘o’}

// b[2:] == []byte{‘l’, ‘a’, ‘n’, ‘g’}

// b[:] == b

下面语法也是基于数组创建一个切片:

x := [3]string{“Лайка”, “Белка”, “Стрелка”}

s := x[:] // a slice referencing the storage of x

切片的内幕

一个切片是一个数组片段的描述。它包含了指向数组的指针,片段的长度, 和容量 (片段的最大长度) 。

前面使用 make([]byte, 5) 创建的切片变量 s 的结构如下:

长度是切片引用的元素数目。容量是底层数组的元素数目 (从切片指针开始) 。关于长度和容量和区域将在下一个例子说明。

我们继续对 s 进行切片,观察切片的数据结构和它引用的底层数组: s = s[2:4]

切片操作并不复制切片指向的元素。它创建一个新的切片并复用原来切片的底层数组。这使得切片操作和数组索引一样高效。因此,通过一个新切片修改元素会影响到原始切片的对应元素。

d := []byte{‘r’, ‘o’, ‘a’, ‘d’}

e := d[2:]

// e == []byte{‘a’, ‘d’}

e[1] = ‘m’

// e == []byte{‘a’, ‘m’}

// d == []byte{‘r’, ‘o’, ‘a’, ‘m’}

前面创建的切片 s 长度小于它的容量。我们可以增长切片的长度为它的容量:

s = s[:cap(s)]

切片增长不能超出其容量。增长超出切片容量将会导致运行时异常,就像切片或数组的索引超出范围引起异常一样。同样,不能使用小于零的索引去访问切片之前的元素。

切片的生长 (copy and append 函数)

要增加切片的容量必须创建一个新的、更大容量的切片,然后将原有切片的内容复制到新的切片。整个技术是一些支持动态数组语言的常见实现。下面的例子将切片 s 容量翻倍,先创建一个2倍容量的新切片 t ,复制 s 的元素到 t ,然后将 t 赋值给 s :

t := make([]byte, len(s), (cap(s)+1)*2) // +1 in case cap(s) == 0

for i := range s {

t[i] = s[i]

}

s = t

循环中复制的操作可以由 copy 内置函数替代。copy 函数将源切片的元素复制到目的切片。它返回复制元素的数目。

func copy(dst, src []T) int

copy 函数支持不同长度的切片之间的复制 (它只复制较短切片的长度个元素) 。此外, copy 函数可以正确处理源和目的切片有重叠的情况。

使用 copy 函数,我们可以简化上面的代码片段:

t := make([]byte, len(s), (cap(s)+1)*2)

copy(t, s)

s = t

一个常见的操作是将数据追加到切片的尾部。下面的函数将元素追加到切片尾部, 必要的话会增加切片的容量,最后返回更新的切片:

func AppendByte(slice []byte, data …byte) []byte {

m := len(slice)

n := m + len(data)

if n > cap(slice) { // if necessary, reallocate

// allocate double what’s needed, for future growth.

newSlice := make([]byte, (n+1)*2)

copy(newSlice, slice)

slice = newSlice

}

slice = slice[0:n]

copy(slice[m:n], data)

return slice

}

下面是 AppendByte 的一种用法:

p := []byte{2, 3, 5}

p = AppendByte(p, 7, 11, 13)

// p == []byte{2, 3, 5, 7, 11, 13}

类似 AppendByte 的函数比较实用,因为它提供了切片容量增长的完全控制。根据程序的特点,可能希望分配较小的活较大的块,或则是超过某个大小再分配。

但大多数程序不需要完全的控制,因此Go提供了一个内置函数 append , 用于大多数场合；它的函数签名:

func append(s []T, x …T) []T

append 函数将 x 追加到切片 s 的末尾,并且在必要的时候增加容量。

a := make([]int, 1)

// a == []int{0}

a = append(a, 1, 2, 3)

// a == []int{0, 1, 2, 3}

如果是要将一个切片追加到另一个切片尾部,需要使用 … 语法将第2个参数展开为参数列表。

a := []string{“John”, “Paul”}

b := []string{“George”, “Ringo”, “Pete”}

a = append(a, b…) // equivalent to “append(a, b[0], b[1], b[2])”

// a == []string{“John”, “Paul”, “George”, “Ringo”, “Pete”}

由于切片的零值 nil 用起来就像一个长度为零的切片,我们可以声明一个切片变量然后在循环中向它追加数据:

// Filter returns a new slice holding only

// the elements of s that satisfy f()

func Filter(s []int, fn func(int) bool) []int {

var p []int // == nil

for _, v := range s {

if fn(v) {

p = append(p, v)

}

return p

}

可能的"陷阱”

正如前面所说,切片操作并不会复制底层的数组。整个数组将被保存在内存中,直到它不再被引用。有时候可能会因为一个小的内存引用导致保存所有的数据。

例如, FindDigits 函数加载整个文件到内存,然后搜索第一个连续的数字,最后结果以切片方式返回。

var digitRegexp = regexp.MustCompile("[0-9]+”)

func FindDigits(filename string) []byte {

b, _ := ioutil.ReadFile(filename)

return digitRegexp.Find(b)

}

这段代码的行为和描述类似,返回的 []byte 指向保存整个文件的数组。因为切片引用了原始的数组, 导致 GC 不能释放数组的空间；只用到少数几个字节却导致整个文件的内容都一直保存在内存里。

要修复整个问题,可以将感兴趣的数据复制到一个新的切片中:

func CopyDigits(filename string) []byte {

b, _ := ioutil.ReadFile(filename)

b = digitRegexp.Find(b)

c := make([]byte, len(b))

copy(c, b)

return c

}

可以使用 append 实现一个更简洁的版本。这留给读者作为练习。

https://blog.go-zh.org/go-slices-usage-and-internals

http://www.cnblogs.com/howDo/archive/2013/04/25/GoLang-Array-Slice.html

数组指针与指针数组数组指针与指针数组听起来似乎有点拗口，那么来展开说明一下：

数组指针： (指向）数组 (的）指针指针数组： (装满了）指针 (的）数组也就是说，数组指针是个指针，它指向一个数组；而指针数组是个数组，它里面装满了指针。

数组指针声明一个数组 a，然后将它的地址赋值给 arrayPointer。这样一来，arrayPointer 就是一个指向数组 a 的指针，即数组指针，它的类型为 *[5]int。

a := [5]int{1, 2, 3, 4, 5} // 把数组 a 的地址赋值给 arrayPointer // arrayPointer 是指向数组的指针，类型为 *[5]int arrayPointer := &a fmt.Println(arrayPointer)

/*Output: &[1 2 3 4 5] */ 指针数组初始化数组 pointerArray，传入的初始化值为整型 m 与 n 的内存地址 (&m 和 &n），那么 pointerArray 就是一个装着 int 类型指针的数组，即指针数组，它的类型为 [2]*int。

m := 1 n := 2 // 初始化 pointerArray，传入 m 与 n 的地址 // pointerArray 包含了整型地址，是一个装着指针的数组 pointerArray := [2]*int{&m, &n} fmt.Println(pointerArray)

/*Output: [0xc0000aa000 0xc0000aa008] */ 总结 ———————————————— 版权声明：本文为CSDN博主「weixin_39693437」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。原文链接：https://blog.csdn.net/weixin_39693437/article/details/111389778

slice 的底层数据结构是什么？给slice赋值，到底赋了什么内容？通过:操作得到的新slice和原slice是什么关系？新slice的长度和容量是多少？ append在背后到底做了哪些事情？ slice的扩容机制是什么？

https://segmentfault.com/a/1190000041181996 https://swsmile.info/post/golang-implement-slice/

Contents