C++中的vector
@[toc]
一、vector简介
- vector是表示可变大小数组的
序列容器。
- 就像数组一样,vector也采用的
连续存储空间
来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。 - 本质讲,vector使用
动态分配
数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。 - 就时间而言,这是一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大小。
- vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。
- 不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
- 因此,vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增长。
- 与其它动态序列容器相比(deques, lists and forward_lists), vector在访问元素的时候更加高效,在末尾添加和删除元素相对高效。
- 对于其它不在末尾的删除和插入操作,效率更低。比起lists和forward_lists统一的迭代器和引用更好
二、vector的相关接口
三、vector的相关问题
- 1.vector的空间增长问题
capacity的代码在vs和g++下分别运行会发现,vs下capacity是按1.5倍增长的,g++是按2倍增长的。
- 这个问题经常会考察,不要固化的认为,顺序表增容都是2倍,具体增长多少是根据具体的需求定义的。vs是PJ版本STL,g++是SGI版本STL。
reserve只负责开辟空间,如果确定知道需要用多少空间,reserve可以缓解vector增容的代价缺陷问 题。
- resize在开空间的同时还会进行初始化,影响size
- 2.vector的迭代器失效问题
// insert/erase导致的迭代器失效
#include <iostream>
#include <algorithm>
#include <vector>
using namespace std;
int main()
{
int a[] = { 1, 2, 3, 4 };
vector<int> v(a, a + sizeof(a) / sizeof(int));
// 使用find查找3所在位置的iterator
vector<int>::iterator pos = find(v.begin(), v.end(), 3);
// 删除pos位置的数据,导致pos迭代器失效。
v.erase(pos);
cout << *pos << endl; // 此处会导致非法访问
// 在pos位置插入数据,导致pos迭代器失效。
// insert会导致迭代器失效,是因为insert可
// 能会导致增容,增容后pos还指向原来的空间,而原来的空间已经释放了。
pos = find(v.begin(), v.end(), 3);
v.insert(pos, 30);
cout << *pos << endl; // 此处会导致非法访问
return 0;
}
// 常见的迭代器失效的场景
#include <iostream>
#include <algorithm>
#include <vector>
using namespace std;
int main()
{
int a[] = { 1, 2, 3, 4 };
vector<int> v(a, a + sizeof(a) / sizeof(int));
// 实现删除v中的所有偶数
// 下面的程序会崩溃掉,如果是偶数,erase导致it失效
// 对失效的迭代器进行++it,会导致程序崩溃
vector<int>::iterator it = v.begin();
while (it != v.end())
{
if (*it % 2 == 0)
v.erase(it);
++it;
}
// 以上程序要改成下面这样,erase会返回删除位置的下一个位置
vector<int>::iterator it = v.begin();
while (it != v.end())
{
if (*it % 2 == 0)
it = v.erase(it);
else
++it;
}
return 0;
}
-
总结迭代器失效问题:
-
迭代器失效的本质:因为C++中的迭代器本质是指针,所以迭代器失效就是指针失效,也就是指针指向非法空间
-
迭代器失效的场景:扩容导致迭代器失效;删除导致迭代器失效。
-
a.扩容导致迭代器失效
-
例如:push_back:
-
原因:
-
因为其内部在空间不足时会自动发生扩容,此处注意vector的扩容机制:申请新空间->拷贝就空间的元素->释放旧空间。
-
一开始让迭代器指向这片空间,而在push_back的过程中,
一旦在内部发生了扩容,这片空间已经释放掉了(不一定是原地扩容),这样就导致迭代器指向已经释放的空间,从而对迭代器进行操作就会造成错误,也就是迭代器失效
-
同样的原理还有:resize,reverse,assign等都可能导致迭代器失效
-
解决方法:
重新给迭代器赋值
auto it = a.begin();
a.push_back(1);//可能会发生扩容
it = a.begin();//重新给迭代器赋值
- b.删除导致迭代器失效
- 例如:earse
auto it = a.begin();
while(it != a.end())
{
//a.erase(it);//可能会导致迭代器失效
//it++;
it = a.erase(it);//重新赋值
}
原因:因为erase用迭代器传参时,删除当前位置,返回的是下一个位置,所以开始错误的写法中返回值并没有接受,并且在原空间中进行++,从而导致迭代器失效
- 解决方法:重新给迭代器赋值
- c.引用失效
vector<int> v {1,2,3,4,5,6};
int& ra = v[0];
ra = 999;
v.push_back(1);
ra = 666;
- 这段代码可能会导致引用失效,同样的道理,经过push_back后,空间可能已经发生了扩容,已经不是原空间了,但是因为引用底层仍是指针,即引用一个不存在的空间,导致引用失效
- d.C++中的容器基本上是左闭右开的区间,所以不能删除end()迭代器位置
四、vector模拟实现
using namespace std;
#include <assert.h>
namespace wolf
{
template<class T>
class vector
{
public:
// Vector的迭代器是一个原生指针
typedef T* iterator;
typedef const T* const_iterator;
iterator begin() { return _start; }
iterator end() { return _finish; }
const_iterator cbegin() const { return _start; }
const_iterator cend() const { return _finish; }
// construct and destroy
vector()
: _start(nullptr)
, _finish(nullptr)
, _endOfStorage(nullptr)
{}
vector(int n, const T& value = T())
: _start(nullptr)
, _finish(nullptr)
, _endOfStorage(nullptr)
{
reserve(n);
while (n--)
{
push_back(value);
}
}
// 如果使用iterator做迭代器,会导致初始化的迭代器区间[first,last)只能是 vector的迭代器
// 重新声明迭代器,迭代器区间[first,last]可以是任意容器的迭代器
template<class InputIterator>
vector(InputIterator first, InputIterator last)
{
reserve(last - first);
while (first != last)
{
push_back(*first);
++first;
}
}
vector(const vector<T>& v)
: _start(nullptr)
, _finish(nullptr)
, _endOfStorage(nullptr)
{
reserve(v.capacity());
iterator it = begin();
const_iterator vit = v.cbegin();
while (vit != v.cend())
{
*it++ = *vit++;
}
_finish = _start + v.size();
_endOfStorage = _start + v.capacity();
}
vector<T>& operator= (vector<T> v)
{
swap(v);
return *this;
}
~vector()
{
delete[] _start;
_start = _finish = _endOfStorage = nullptr;
}
// capacity
size_t size() const { return _finish - _start; }
size_t capacity() const { return _endOfStorage - _start; }
void reserve(size_t n)
{
if (n > capacity())
{
size_t oldSize = size();
T* tmp = new T[n];
// 这里直接使用memcpy?
//if (_start)
// memcpy(tmp, _start, sizeof(T)*size);
if (_start)
{
for (size_t i = 0; i < oldSize; ++i)
tmp[i] = _start[i];
}
_start = tmp;
_finish = _start + size;
_endOfStorage = _start + n;
}
}
void resize(size_t n, const T& value = T())
{
// 1.如果n小于当前的size,则数据个数缩小到n
if (n <= size())
{
_finish = _start + n;
return;
}
// 2.空间不够则增容
if (n > capacity())
reserve(n);
// 3.将size扩大到n
iterator it = _finish;
iterator _finish = _start + n;
while (it != _finish)
{
*it = value;
++it;
}
}
///////////////access///////////////////////////////
T& operator[](size_t pos){return _start[pos];}
const T& operator[](size_t pos)const {return _start[pos];}
///////////////modify/////////////////////////////
void push_back(const T& x){insert(end(), x);}
void pop_back(){erase(--end());}
void swap(vector<T>& v)
{
swap(_start, v._start);
swap(_finish, v._finish);
swap(_endOfStorage, v._endOfStorage);
}
iterator insert(iterator pos, const T& x)
{
assert(pos <= _finish);
// 空间不够先进行增容
if (_finish == _endOfStorage)
{
size_t size = size();
size_t newCapacity = (0 == capacity())? 1 : capacity() * 2;
reserve(newCapacity);
// 如果发生了增容,需要重置pos
pos = _start + size;
}
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
--end;
}
*pos = x;
++_finish;
return pos;
}
// 方便解决:一边遍历一边删除的迭代器失效问题
iterator erase(Iterator pos)
{
// 挪动数据进行删除
iterator begin = pos + 1;
while (begin != _finish) {
*(begin - 1) = *begin;
++begin;
}
--_finish;
return pos;
}
private:
iterator _start; // 指向数据块的开始
iterator _finish; // 指向有效数据的尾
iterator _endOfStorage; // 指向存储容量的尾
};
}
评论区