Объявление строк. Конструкторы класса StringBuilder
Объекты этого класса объявляются с явным вызовом конструктора класса. Поскольку специальных констант этого типа не существует, то вызов конструктора для инициализации объекта просто необходим. Конструктор класса перегружен, и наряду с конструктором без параметров, создающим пустую строку, имеется набор конструкторов, которым можно передать две группы параметров. Первая группа позволяет задать строку или подстроку, значением которой будет инициализироваться создаваемый объект класса StringBuilder. Вторая группа параметров позволяет задать емкость объекта - объем памяти, отводимой данному экземпляру класса StringBuilder. Каждая из этих групп не является обязательной и может быть опущена. Примером может служить конструктор без параметров, который создает объект, инициализированный пустой строкой, и с некоторой емкостью , заданной по умолчанию, значение которой зависит от реализации. Приведу в качестве примера синтаксис трех конструкторов:
- public StringBuilder (string str, int cap). Параметр str задает строку инициализации, cap - емкость объекта;
- public StringBuilder (int curcap, int maxcap). Параметры curcap и maxcap задают начальную и максимальную емкость объекта;
- public StringBuilder (string str, int start, int len, int cap). Параметры str, start, len задают строку инициализации, cap - емкость объекта.
Операции над строками
Над строками этого класса определены практически те же операции с той же семантикой, что и над строками класса String:
- присваивание (=);
- две операции проверки эквивалентности (= =) и (!=);
- взятие индекса ([]).
Операция конкатенации (+) не определена над строками класса StringBuilder, ее роль играет метод Append, дописывающий новую строку в хвост уже существующей.
Со строкой этого класса можно работать как с массивом, но, в отличие от класса String, здесь уже все делается как надо: допускается не только чтение отдельного символа, но и его изменение. Рассмотрим с небольшими модификациями наш старый пример:
public void TestStringBuilder(){ //Строки класса StringBuilder //операции над строками StringBuilder s1 =new StringBuilder("ABC"), s2 =new StringBuilder("CDE"); StringBuilder s3 = new StringBuilder(); //s3= s1+s2; s3= s1.Append(s2); bool b1 = (s1==s3); char ch1 = s1[0], ch2=s2[0]; Console.WriteLine("s1={0}, s2={1}, b1={2}," + "ch1={3}, ch2={4}", s1,s2,b1,ch1,ch2); s2 = s1; b1 = (s1!=s2); ch2 = s2[0]; Console.WriteLine("s1={0}, s2={1}, b1={2}," + "ch1={3}, ch2={4}", s1,s2,b1,ch1,ch2); StringBuilder s = new StringBuilder("Zenon"); s[0]='L'; Console.WriteLine(s);}//TestStringBuilderЭтот пример демонстрирует возможность выполнения над строками класса StringBuilder тех же операций, что и над строками класса String. В результате присваивания создается дополнительная ссылка на объект, операции проверки на эквивалентность работают со значениями строк, а не со ссылками на них. Конкатенацию можно заменить вызовом метода Append. Появляется новая возможность - изменять отдельные символы строки. (Для того чтобы имя класса StringBuilder стало доступным, в проект добавлено предложение using System.Text, ссылающееся на соответствующее пространство имен.)
Основные методы
У класса StringBuilder методов значительно меньше, чем у класса String. Это и понятно - класс создавался с целью дать возможность изменять значение строки. По этой причине у класса есть основные методы, позволяющие выполнять такие операции над строкой как вставка, удаление и замена подстрок, но нет методов, подобных поиску вхождения, которые можно выполнять над обычными строками. Технология работы обычно такова: конструируется строка класса StringBuilder; выполняются операции, требующие изменение значения; полученная строка преобразуется в строку класса String; над этой строкой выполняются операции, не требующие изменения значения строки. Давайте чуть более подробно рассмотрим основные методы класса StringBuilder:
- public StringBuilder Append (<объект>). К строке, вызвавшей метод, присоединяется строка, полученная из объекта, который передан методу в качестве параметра. Метод перегружен и может принимать на входе объекты всех простых типов, начиная от char и bool до string и long. Поскольку объекты всех этих типов имеют метод ToString, всегда есть возможность преобразовать объект в строку, которая и присоединяется к исходной строке. В качестве результата возвращается ссылка на объект, вызвавший метод. Поскольку возвращаемую ссылку ничему присваивать не нужно, то правильнее считать, что метод изменяет значение строки;
- public StringBuilder Insert (int location,<объект>). Метод вставляет строку, полученную из объекта, в позицию, указанную параметром location. Метод Append является частным случаем метода Insert;
- public StringBuilder Remove (int start, int len). Метод удаляет подстроку длины len, начинающуюся с позиции start;
- public StringBuilder Replace (string str1,string str2). Все вхождения подстроки str1 заменяются на строку str2;
- public StringBuilder AppendFormat (<строка форматов>, <объекты>). Метод является комбинацией метода Format класса String и метода Append. Строка форматов, переданная методу, содержит только спецификации форматов. В соответствии с этими спецификациями находятся и форматируются объекты. Полученные в результате форматирования строки присоединяются в конец исходной строки.
За исключением метода Remove, все рассмотренные методы являются перегруженными. В их описании дана схема вызова метода, а не точный синтаксис перегруженных реализаций. Приведу примеры, чтобы продемонстрировать, как вызываются и как работают эти методы:
//Методы Insert, Append, AppendFormatStringBuilder strbuild = new StringBuilder();string str = "это это не ";strbuild.Append(str); strbuild.Append(true);strbuild.Insert(4,false); strbuild.Insert(0,"2*2=5 - ");Console.WriteLine(strbuild);string txt = "А это пшеница, которая в темном чулане хранится," +" в доме, который построил Джек!";StringBuilder txtbuild = new StringBuilder();int num =1;foreach(string sub in txt.Split(',')){ txtbuild.AppendFormat(" {0}: {1} ", num++,sub);}str = txtbuild.ToString();Console.WriteLine(str);
В этом фрагменте кода конструируются две строки. Первая из них создается из строк и булевых значений true и false. Для конструирования используются методы Insert и Append. Вторая строка конструируется в цикле с применением метода AppendFormat. Результатом этого конструирования является строка, в которой простые предложения исходного текста пронумерованы.
Обратите внимание, что сконструированная вторая строка передается в обычную строку класса String. Никаких проблем преобразования строк одного класса в другой класс не возникает, поскольку все объекты, в том числе, объекты класса StringBuilder, обладают по определению методом ToString.
Обратите внимание, как выглядят результаты работы.
Рис. 14.4. Операции и методы класса StringBuilder
14. Лекция: Строки C#. Классы String и StringBuilder
14.5
Емкость буфера
Каждый экземпляр строки класса StringBuilder имеет буфер, в котором хранится строка. Объем буфера - его емкость - может меняться в процессе работы со строкой. Объекты класса имеют две характеристики емкости - текущую и максимальную. В процессе работы текущая емкость изменяется, естественно, в пределах максимальной емкости, которая реально достаточно высока. Если размер строки увеличивается, то соответственно автоматически растет и текущая емкость. Если же размер строки уменьшается, то емкость буфера остается на том же уровне. По этой причине иногда разумно уменьшать емкость. Следует помнить, что попытка уменьшить емкость до величины, меньшей длины строки, приведет к ошибке.
У класса StringBuilder имеется 2 свойства и один метод, позволяющие анализировать и управлять емкостными свойствами буфера. Напомню, что этими характеристиками можно управлять также еще на этапе создания объекта, - для этого имеется соответствующий конструктор. Рассмотрим свойства и метод класса, связанные с емкостью буфера:
- свойство Capacity - возвращает или устанавливает текущую емкость буфера;
- свойство MaxCapacity - возвращает максимальную емкость буфера. Результат один и тот же для всех экземпляров класса;
- метод int EnsureCapacity (int capacity) - позволяет уменьшить емкость буфера. Метод пытается вначале установить емкость, заданную параметром capacity; если это значение меньше размера хранимой строки, то емкость устанавливается такой, чтобы гарантировать размещение строки. Это число и возвращается в качестве результата работы метода.
Приведу код, в котором проводятся различные эксперименты с емкостью буфера:
//Емкость буфераint curvol1 = txtbuild.Capacity;int curvol2 = strbuild.Capacity;int maxvol1 = txtbuild.MaxCapacity;int maxvol2 = strbuild.MaxCapacity; Console.WriteLine("curvol1= {0}",curvol1);Console.WriteLine("curvol2= {0}",curvol2);Console.WriteLine("maxvol1= {0}",maxvol1);Console.WriteLine("maxvol2= {0}",maxvol2);int sure1 = txtbuild.EnsureCapacity(100);int sure2 = strbuild.EnsureCapacity(100);Console.WriteLine("sure1= {0}",sure1);Console.WriteLine("sure2= {0}",sure2);curvol2 = strbuild.Capacity;Console.WriteLine("curvol2= {0}",curvol2);//ошибка! попытка установить емкость меньше длины строки//strbuild.Capacity = 25;strbuild.Capacity = 256; //так можно!curvol2 = strbuild.Capacity;Console.WriteLine("curvol2= {0}",curvol2);//увеличим строку - емкость увеличитсяint len = txtbuild.Length;txtbuild.Append(txtbuild.ToString());curvol1 = txtbuild.Capacity;Console.WriteLine("curvol1= {0}",curvol1);//уменьшим строкуtxtbuild.Remove(len, len);curvol1 = txtbuild.Capacity;Console.WriteLine("curvol1= {0}",curvol1);В этом фрагменте кода анализируются и изменятся емкостные свойства буфера двух объектов. Демонстрируется, как меняется емкость при увеличении и уменьшении размера строки. Результаты работы этого фрагмента кода показаны на рис. 14.5.
Рис. 14.5. Анализ емкостных свойств буфера
15. Лекция: Регулярные выражения
15.1
Регулярные выражения. Пространство RegularExpressions и его классы. Регулярные выражения и языки. Теория регулярных выражений. Практика применения регулярных выражений. Разбор текстов и поиск по образцу. Свойства и методы класса Regex и других классов, связанных с регулярными выражениями. Примеры применения регулярных выражений.