如何在 Go 中使用切片容量和长度

来做一个快速测验-以下代码输出什么?

vals := make([]int, 5)
for i := 0; i < 5; i++ {
  vals = append(vals, i)
}
fmt.Println(vals)

Run it on the Go Playground → https://play.golang.org/p/7PgUqBdZ6Z

如果猜到了[0 0 0 0 0 0 1 2 3 4],那么你是正确的。 等一下为什么不是[0 1 2 3 4]

如果答错了,也不担心。从其他语言过渡到Go时,这是一个相当普遍的错误,在本文中,我们将介绍为什么输出不符合你的预期以及如何利用Go的细微差别来提高代码效率。

Slices vs Arrays

在Go中,既有数组又有切片。切片和数组之间有很多区别,数组的长度是其类型的一部分,所以数组不能改变大小,而切片可以具有动态大小,因为切片是数组的包装。这是什么意思?假设我们有一个数组var a [10]int。此数组的大小固定,无法更改。如果我们调用len(a),它将始终返回10,因为该大小10是该类型[10]int的一部分。如果你在数组中需要10个以上的项,则必须创建一个类型完全不同的新对象,例如var b [11] int,然后将所有值从a复制到b。

虽然在特定情况下使用具有固定大小的数组很有价值,但通常来说这并不是开发人员想要的。相反,我们希望使用与Go中的数组类似的东西,但是具有随着时间增加长度的能力。一种简单的方法是创建一个比需要的数组大得多的数组,然后将该数组的子集当作使用的数组。下面的代码显示了一个示例。

var vals [20]int
for i := 0; i < 5; i++ {
  vals[i] = i * i
}
subsetLen := 5

fmt.Println("The subset of our array has a length of:", subsetLen)

// Add a new item to our array
vals[subsetLen] = 123
subsetLen++
fmt.Println("The subset of our array has a length of:", subsetLen)

Run it on the Go Playground → https://play.golang.org/p/Np6-NEohm2

上面代码中,我们将一个数组其大小设置为20,但是由于我们仅使用一个子集,因此我们的代码可以假装数组的长度为5,然后在向数组中添加新项后为6。

(很粗略地说)这就是切片的工作方式。它们包装一个具有设定大小的数组,就像上一个示例中的数组具有20的设定大小一样。它们还跟踪程序可使用的数组子集-length属性,它类似于上一示例中的subsetLen变量。

切片还具有一个容量,类似于上一个示例中数组(20)的总长度。这很有用,因为它告诉你子集可以增长多大之后才能不再适合支撑切片的底层数组。当发生这种情况时,将会分配一个新的数组来支撑切片,但是所有这些逻辑都隐藏在append函数的后面。

简而言之,将sliceappend函数结合在一起可以为我们提供一种与数组非常相似的类型,但是随着时间的增长,它可以处理更多元素。

让我们再次看一下前面的示例,但是这次我们将使用切片而不是数组。

var vals []int
for i := 0; i < 5; i++ {
  vals = append(vals, i)
  fmt.Println("The length of our slice is:", len(vals))
  fmt.Println("The capacity of our slice is:", cap(vals))
}

// Add a new item to our array
vals = append(vals, 123)
fmt.Println("The length of our slice is:", len(vals))
fmt.Println("The capacity of our slice is:", cap(vals))

// Accessing items is the same as an array
fmt.Println(vals[5])
fmt.Println(vals[2])

Run it on the Go Playground → https://play.golang.org/p/M_qaNGVbC-

我们仍然可以像访问数组一样访问切片中的元素,但是通过使用切片和append函数,我们不再需要考虑支持数组的大小。通过使用lencap函数,我们仍然可以弄清楚这些事情,但是我们不必太担心它们。

考虑到这一点,让我们回顾一下文章开头的测验代码,看看出了什么问题。

vals := make([]int, 5)
for i := 0; i < 5; i++ {
  vals = append(vals, i)
}
fmt.Println(vals)

调用make时,我们最多可以传入3个参数。第一个是我们要分配的类型,第二个是类型的长度,第三个是类型的容量(此参数是可选的)。

通过make([] int, 5),我们告诉程序要创建一个长度为5的切片,并且容量默认为提供的长度-在这里是5。虽然这看起来似乎是我们最初想要的,但这里的重要区别是我们告诉切片要将长度和容量都设置为5,make 将切片初始化为[0 ,0 ,0 ,0 ,0]然后继续调用append函数,因此它将增加容量并在切片的末尾开始添加新元素。

如果在代码中添加Println()语句,可以看到容量的变化。

vals := make([]int, 5)
fmt.Println("Capacity was:", cap(vals))
for i := 0; i < 5; i++ {
  vals = append(vals, i)
  fmt.Println("Capacity is now:", cap(vals))
}

fmt.Println(vals)

Run it on the Go Playground → https://play.golang.org/p/d6OUulTYM7

结果,我们最终得到了输出[0 0 0 0 0 0 0 1 2 3 4]而不是期望的[0 1 2 3 4]。 我们该如何解决?嗯,有几种方法可以做到这一点,我们将介绍其中两种,你可以择最适合自己情况的一种。

不使用 append, 直接用索引写入

第一个解决方法是保持make调用不变,并明确声明要将每个元素设置为的索引。

vals := make([]int, 5)
for i := 0; i < 5; i++ {
  vals[i] = i
}
fmt.Println(vals)

Run it on the Go Playground → https://play.golang.org/p/JI8Fx3fJCU

我们设置的值恰好与我们要使用的索引相同,但是您也可以独立跟踪索引。 例如,如果您想获取map的key,则可以使用以下代码:

package main

import "fmt"

func main() {
  fmt.Println(keys(map[string]struct{}{
    "dog": struct{}{},
    "cat": struct{}{},
  }))
}

func keys(m map[string]struct{}) []string {
  ret := make([]string, len(m))
  i := 0
  for key := range m {
    ret[i] = key
    i++
  }
  return ret
}

Run it on the Go Playground → https://play.golang.org/p/kIKxkdX35B

这之所以行之有效,是因为我们知道返回的切片的确切长度将与map的长度相同,因此我们可以使用该长度初始化切片,然后将每个元素分配给适当的索引。这种方法的缺点是我们必须跟踪i,以便我们知道将每个值放入哪个索引。

这导致我们进入第二种方法

使用0作为长度,并指定容量

我们更新make调用,在切片类型之后为其提供两个参数。首先,新切片的长度将设置为0,因此我们没有在切片中添加任何新元素。第二个参数是新切片的容量,将被设置为map参数的长度,因为我们知道切片最终的长度就是 map 的长度。

这仍将在幕后构造与上一个示例相同的数组,但是现在,当我们调用append时,它将知道将元素放置在切片的开头,因为切片的长度为0。

package main

import "fmt"

func main() {
  fmt.Println(keys(map[string]struct{}{
    "dog": struct{}{},
    "cat": struct{}{},
  }))
}

func keys(m map[string]struct{}) []string {
  ret := make([]string, 0, len(m))
  for key := range m {
    ret = append(ret, key)
  }
  return ret
}

Run it on the Go Playground → https://play.golang.org/p/h5hVAHmqJm

使用 append 能自动扩容,为什么还要关心切片的容量

你可能要问的下一件事是:“如果append函数可以为我增加切片的容量,我们为什么还要告诉程序一个容量?”

事实是,在大多数情况下,无需太担心这一点。如果它使您的代码复杂得多,只需使用var vals []int初始化切片,然后让append函数处理繁重的工作。但是针对知道切片最终长度的情况,我们可以在初始化切片时声明其容量,从而使程序不必执行不必要的内存分配。

请在Go Playground上运行以下代码。每当容量增加时,我们的程序就需要执行另一次内存分配:

package main

import "fmt"

func main() {
  fmt.Println(keys(map[string]struct{}{
    "dog":       struct{}{},
    "cat":       struct{}{},
    "mouse":     struct{}{},
    "wolf":      struct{}{},
    "alligator": struct{}{},
  }))
}

func keys(m map[string]struct{}) []string {
  var ret []string
  fmt.Println(cap(ret))
  for key := range m {
    ret = append(ret, key)
    fmt.Println(cap(ret))
  }
  return ret
}

Run it on the Go Playground → https://play.golang.org/p/fDbAxtAjLF

现在将切片预设容量后将其与上面相同的代码进行比较:

package main

import "fmt"

func main() {
  fmt.Println(keys(map[string]struct{}{
    "dog":       struct{}{},
    "cat":       struct{}{},
    "mouse":     struct{}{},
    "wolf":      struct{}{},
    "alligator": struct{}{},
  }))
}

func keys(m map[string]struct{}) []string {
  ret := make([]string, 0, len(m))
  fmt.Println(cap(ret))
  for key := range m {
    ret = append(ret, key)
    fmt.Println(cap(ret))
  }
  return ret
}

Run it on the Go Playground → https://play.golang.org/p/nwT8X9-7eQ

在第一个代码示例中,我们的容量从0开始,然后增加到1、2、4,最后是8,这意味着我们必须在5个不同的时间分配一个新数组,此外,最后一个数组用于支持我们slice的容量为8,大于我们最终需要的容量。 另一方面,我们的第二个示例以相同的容量(5)开始和结束,并且只需要在keys()函数开始时分配一次即可。我们还避免浪费任何额外的内存。

不要过度优化

通常不鼓励任何人担心像这样的次要优化,但是在确实很明显最终大小应该是多少的情况下,强烈建议为切片设置适当的容量或长度。

它不仅有助于提高应用程序的性能,而且还可以通过明确说明输入大小和输出大小之间的关系来帮助理清代码。

本文并不是要对切片或数组之间的差异进行详尽的讨论,而只是要简要介绍容量和长度如何影响切片以及它们在不同解决方案中的作用。


WX20191117-152623@2x.png

课程推荐:简明高效的Go语言入门和实战指南

Image placeholder
yutlong
未设置
  72人点赞

没有讨论,发表一下自己的看法吧

推荐文章
Go语言高级编程_3.3 常量和全局变量

3.3常量和全局变量 程序中的一切变量的初始值都直接或间接地依赖常量或常量表达式生成。在Go语言中很多变量是默认零值初始化的,但是Go汇编中定义的变量最好还是手工通过常量初始化。有了常量之后,就可以衍

行业目前最大容量,东芝16TB硬盘里藏了哪些技术?

强大的SSD似乎给硬盘(HDD)带来了“毁灭性”的打击,使其淡出存储舞台,但事实并非如此。这种冲击确实存在,不过更多在消费级硬盘市场。对于企业级的数据存储,可以说从现在到未来很长一段时间内,硬盘依旧会

代表性企业级大容量氦气硬盘解析:希捷Exos X14

 海量数据时代,AI、大数据、物联网等技术不止带来了业务应用的转型,还带来了数据的“井喷式”爆发增长。IDC曾预测,2025年全球数据量将高达163ZB。在如此情况下,数据存储成了一个至关重要的问题,

万万没想到,HashMap默认容量的选择,竟然背后有这么多思考!?

集合是Java开发日常开发中经常会使用到的,而作为一种典型的K-V结构的数据结构,HashMap对于Java开发者一定不陌生。在日常开发中,我们经常会像如下方式以下创建一个HashMap:Map ma

Java 8 并发教程:原子变量和 ConcurrentMap

出于简单的因素,这个教程的代码示例使用了定义在这里的两个辅助函数sleep(seconds)和stop(executor)。 AtomicInteger java.concurrent.atomic包

Go 切片 slice - Go 学习记录

Go切片slice slice切片类型基本概念 slice总是指向一个底层的array,slice的声明也可以像array一样,只是不需要定义长度 slice并不是真正意义上的动态数组,而是一个引用

介绍 Go 的数组和切片

学习在Go中使用数组和切片存储数据的优缺点,以及为什么其中一个比另一个更好图片来自于:carrotmadman6.ModifiedbyOpensource.com.CCBY-SA2.0 数组 数组是编

Go语言高级编程_1.3 数组、字符串和切片

1.3数组、字符串和切片 在主流的编程语言中数组及其相关的数据结构是使用得最为频繁的,只有在它(们)不能满足时才会考虑链表、hash表(hash表可以看作是数组和链表的混合体)和更复杂的自定义数据结构

Go 切片绕坑指南

在Go中按值传递时,为什么有时会更改切片?不知道大家有没有发现在一个函数内部对切片参数进行了排序后也会改变函数外部原来的切片中元素的顺序,但是在函数内向切片增加了元素后在函数外的原切片却没有新增元素,

Bash技巧:使用参数扩展获取变量的子字符串和字符串长度

在bash中,通常使用${parameter}表达式来获取parameter变量的值,这是一种参数扩展(parameterexpansion)。Bash还提供了其他形式的参数扩展,可以对变量值做一些处

第 10 节:复合类型 2: 切片

2:切片07切片定义和使用切片:切片与数组相比切片的长度是不固定的,可以追加元素,在追加时可能使切片的容量增大,所以可以将切片理解成“动态数组”,但是,它不是数组。packagemain impor

第 10 节:复合类型- 6.指针和切片

6.指针和切片packagemain import"fmt" funcmain0701(){ slice:=[]int{1,2,3,4,5,6,7,8,9,10} //指针和切片建立关系 p:=

Go编程语言教程_1.1. 如何在Windows上安装Go?

先决条件:Go编程语言简介 之前,我们从在系统上安装Golang的过程开始。我们必须对Go语言是什么以及它实际上是什么有第一手的了解。Go是Google的RobertGriesemer,RobPike

Go编程语言教程_1.2. 如何在MacOS上安装Golang?

之前,我们从在系统上安装Golang的过程开始。我们必须对Go语言是什么以及它实际上是什么有第一手的了解。Go是Google的RobertGriesemer,RobPike和KenThompson于2

一步步教你如何在 Django REST API 中构建使用 JWT 验证

基于令牌的身份验证,允许后端服务与前端(无论是web端,原生移动端或其他端)分离,并驻留在不同域中。JSONWebTokens(JWT)是一种流行的令牌认证实现,在本文中,我们使用它来验证,通过Dj

Go 中使用 memcache 存储对象

之于B/S端用http连接,像mysql,redis,memcache这种服务端之间的交流,通常直接采用TCP通信。而对于缓存的内存存储,过期时间是必备,进行必要的对象序列化编码也不可缺。本文用me

在 Golang 中使用 Protobuf

本教程使用proto3版本的protocolbuffer语言,提供了一个基本的在Go程序中使用protocolbuffer的介绍。通过创建一个简单的示例应用程序,向你展示如何在.proto文件中定义消

如何在 CentOS 中安装 PHP 7.4

本指南提供了在CentOS8/RHEL8Linux系统上安装PHP7.4的步骤。有兴趣的开发者已经可以在生产环境中使用使用PHP7.4,正式版本的官方发布时间为2019年11月28日。 请按照以下步

如何在 CentOS 中安装 PHP 7.4

本指南提供了在CentOS8/RHEL8Linux系统上安装PHP7.4的步骤。有兴趣的开发者已经可以在生产环境中使用使用PHP7.4,正式版本的官方发布时间为2019年11月28日。 请按照以下步骤

如何在 CentOS 中安装 PHP 7.4

本指南提供了在CentOS8/RHEL8Linux系统上安装PHP7.4的步骤。有兴趣的开发者已经可以在生产环境中使用使用PHP7.4,正式版本的官方发布时间为2019年11月28日。请按照以下步骤在

如何在 Laravel 6 中缓存数据库查询结果?

在加快应用程序速度方面,缓存可能是最有效的。Laravel预先安装了缓存驱动程序。因此你可以直接使用Redis,Memcached或者使用本地文件进行缓存操作。Laravel附带了此功能。这一次,我们

如何在复杂的后端系统中保证数据库安全?

以技术为中心的时代,信息至关重要。数据库及其安全性已成为每个企业极具挑战性的任务。数据库可以包含关键信息,例如个人身份、信用卡信息、金融交易以及应用程序密码,这些都是对黑客和网络犯罪分子有价值的信息。

深度复盘GitHub发展史:如何在短短10年内改变了人们的编程方式?

前不久,微软以75亿美元的价格收购GitHub,引发了科技行业的关注。在短短的10年内,GitHub改变了人们的编程方式。不仅让编程变得更简单,还改变了软件开发者对编程的看法。GitHub是如何做到的

如何在生产环境中部署Kubernetes集群?

如果把kubernetes集群应用于生产环境中,需要做哪些准备?我们先要弄清楚一个词,什么是“生产就绪”?生产就绪,是我们经常听到的一个专业术语,大概意思是已经准备好并已处于即将生产的状态。但是,到底

如何在多云环境中管理数据?

在多云环境中建立数据治理策略没有灵丹妙药。在这里,我们将讨论为什么会有这种说法的原因,以及有关多云环境的IT领导者如何思考数据治理的一些方法。数据治理有点像健身:它不仅仅是一个目的,更是一个持续的过程