Помимо data существует ещё одно ключевое слово, предназначенное для определения нового типа. Оно так и называется — newtype. Эти слова похожи друг на друга «в одну сторону»: вы можете поставить data на место newtype, но не наоборот.
Тип, определяемый с помощью слова newtype, обязан иметь один и только один конструктор значения. Мы можем написать так:
newtype IPAddress = IP StringА вот так не можем:
newtype IPAddress = IP String | LocalhostКомпилятор заупрямится:
A newtype must have exactly one constructor,
but ‘IPAddress’ has two
In the newtype declaration for ‘IPAddress’Кроме того, в таком типе должно быть одно и лишь одно поле. То есть можно так:
newtype IPAddress = IP StringИли же так, с меткой:
newtype IPAddress = IP { value :: String }А вот два или более полей запихнуть не удастся:
newtype EndPoint = EndPoint String IntКомпилятор вновь обратит наше внимание на проблему:
The constructor of a newtype must have exactly one field
but ‘EndPoint’ has two
In the definition of data constructor ‘EndPoint’
In the newtype declaration for ‘EndPoint’Более того, нульарный конструктор тоже не подойдёт:
newtype HardDay = MondayИ вновь ошибка:
The constructor of a newtype must have exactly one field
but ‘Monday’ has noneВ самом деле, зачем нам нужно такое хозяйство? Это нельзя, то нельзя. Какой смысл?
Смысл в оптимизации. Обратите внимание на модель newtype:
newtype IPAddress = IP String
новый название конструктор Поле
тип значенияФактически, newtype берёт одно-единственное значение некоторого существующего типа и всего лишь оборачивает его в свой конструктор. Именно поэтому тип, введённый с помощью newtype, не относится к АТД, и с точки зрения компилятора он является лишь переименованием типа (англ. type renaming). Это делает такой тип более простым и эффективным с точки зрения представления в памяти, нежели тип, определяемый с data.
Когда мы пишем так:
data IPAddress = IP Stringмы говорим компилятору: «IPAddress — это абсолютно новый и самобытный тип, которого никогда не было ранее». А когда пишем так:
newtype IPAddress = IP Stringмы говорим: «IPAddress — это всего лишь обёртка для значения уже существующего типа String».
Внимательный читатель спросит, в чём же фундаментальное отличие типов, вводимых с помощью newtype, от типов, вводимых с помощью type? Там синоним, тут — обёртка. Отличие вот в чём.
Когда мы пишем так:
type String = [Char]мы объявляем: «Тип String — это эквивалентная замена типу [Char]». И поэтому везде, где в коде стоит [Char], мы можем поставить String, и везде, где стоит String, мы можем поставить [Char]. Например, если функция объявлена так:
replace :: String
-> String
-> String
-> Stringмы можем спокойно переписать объявление:
replace :: [Char]
-> [Char]
-> [Char]
-> [Char]и ничего не изменится.
Когда же мы пишем так:
newtype MyInt = MyInt Intмы объявляем: «Тип MyInt — это новый тип, представление которого такое же, как у типа Int». Мы не можем просто взять и поставить MyInt на место Int, потому что эти типы равны лишь с точки зрения представления в памяти, с точки зрения системы типов они абсолютно различны.
А зачем же нам нужно это? Для простоты и надёжности кода. Допустим, есть такая функция:
getBuildsInfo :: String -> Int -> BuildsInfo
getBuildsInfo projectName limit = ...Эта функция запрашивает у CI-сервиса (через REST API) информацию о сборках проекта. Из определения мы видим, что первым аргументом выступает имя проекта, а вторым — количество сборок. Однако в месте применения функции это может быть не столь очевидным:
let info = getBuildsInfo "ohaskell.guide" 4Что такое первая строка? Что такое второе число? Неясно, нужно глядеть в определение, ведь даже объявление не расскажет нам правду:
getBuildsInfo :: String -> Int -> BuildsInfo
что за что за
строка? число?Вот тут нам и помогают наши типы, ведь стандартные String и Int сами по себе не несут никакой полезной информации о своём содержимом. Конечно, мы могли бы обойтись и без типов, просто введя промежуточные выражения:
let project = "ohaskell.guide"
limit = 4
info = getBuildsInfo project limitОднако программист может этого и не сделать, и тогда мы получим «магические значения», смысл которых нам неизвестен. Куда лучше ввести собственные типы:
newtype Project = Project String
newtype Limit = Limit Int
getBuildsInfo :: Project -> Limit -> BuildsInfo
уже не уже не
просто просто
строка числоЭто заставит нас писать явно:
let info = getBuildsInfo (Project "ohaskell.guide")
(Limit 4)Теперь, даже без промежуточных выражений, смысл строки и числа вполне очевиден. Это важный принцип в Haskell: безликие типы наподобие String или Int заменять на типы, имеющие конкретный смысл для нас.
Кроме того, newtype-типы помогают нам не допускать глупых ошибок. Например, есть другая функция:
getArtifacts :: String -> Int -> Int -> [Project]
getArtifacts projectName limit offset = ...Мало того, что перед нами вновь безликие Int, так их ещё и два. И вот какая нелепая ошибка может нас поджидать:
let project = "ohaskell.guide"
limit = 4
offset = 1
info = getArtifacts project offset limitЗаметили? Мы случайно перепутали аргументы местами, поставив offset на место limit. Работа функции при этом нарушится, однако компилятор останется нем как рыба, ведь с точки зрения системы типов ошибки не произошло: и там Int, и тут Int. Синонимы для Int также не помогли бы. Однако если у нас будут newtype-типы:
newtype Limit = Limit Int
newtype Offset = Offset Intтогда подобная ошибка не пройдёт незамеченной:
let project = "ohaskell.guide"
limit = Limit 4
offset = Offset 1
info = getArtifacts offset limitТипы аргументов теперь разные, а значит, путаница между ними гарантированно прервёт компиляцию.
Вот такие они, newtype-типы. В последующих главах мы увидим ещё большую мощь системы типов Haskell.