Sunday, July 12, 2020

Haskell: Օր առաջին. Ֆակտորիալ

Այս կիրակի ես վերջապես որոշեցի սկսել ծանոթությունը Haskell լեզվի հետ։ Haskel-ը ֆունկցիանալ լեզու է. երբեմն ասում են, որ այն ֆունկցիոնալների մեջ ամենաֆունկցիոնալն է։ Ես, ինչ-որ տարրական պատկերացում ունենալով ֆունկցիոնալ ծրագրավորման մասին, ինձ համար սահմանեցի հետևյալ առաջին խնդիրը.

Ֆակտորիալ։ Գրել ծրագիր, որ հրամանային տողից ստանում է որևէ դրական ամբողջ թիվ, ապա հաշվարկում և արտածում է այդ թվի ֆակտորիալը։

Բայց, մինչև խնդրի լուծմանն անցնելը, ես պիտի պատրաստեմ Haskell լեզվի միջավայրը, որում աշխատեցնելու եմ իմ գրած ծրագրերը։ Կարելի է, իհարկե, օգտագործել որևէ առցանց ծառայություն, ինչպիսիք են, օրինակ, www.tutorialspoint.com-ը կամ https://repl.it-ը, բայց ես նախընտրում եմ ամեն ինչ ունենալ ձեռքի տակ՝ իմ մեքենայի վրա։

Իսկ իմ մեքենան Raspberry Pi է` Debian-ի հիման վրա կառուցված օպերացիոն համակարգով։ Haskell Platformէջից գտա, թե ինչպես է պետք տեղադրել Haskell-ի կոմպիլյատորն ու ինտերպրետատորը.

$ sudo apt-get install haskell-platform

Haskel Platform-ի կոմպիլյատորի և ինտերպրետատորի հաջող տեղադրված լինելը ստուգելու համար նախ հրամանային տողից աշխատեցեմ ghci ինտերպրետատորը.

$ ghci
GHCi, version 8.4.4: http://www.haskell.org/ghc/  :? for help
Prelude>

Հրավերքի տողում Prelude ցույց է տալիս, որ ինտերպրետատորը գործարկվել է և ակտիվ է Prelude փաթեթը։ Խնդրեմ Հասկելին ցույց տալ π թվի արժեքը.

Prelude> pi
3.141592653589793

Կարծես թե աշխատում է։ Փորձեմ հենց այստեղ սահմանել ֆակտորիալը հաշվող ֆունկցիան՝ ամենապարզ մոտեցմամբ.

Prelude> factorial n = if n == 1 then 1 else n * factorial (n - 1)

Մի քանի օրինակներով համոզվեմ, որ սահմանած ֆունկցիան աշխատում է.

Prelude> factorial 1
1
Prelude> factorial 5
120
Prelude> factorial 10
3628800
Prelude> factorial 100
93326215443944152681699238856266700490715968264381621468592963895217599993229915608941463976156518286253697920827223758251185210916864000000000000000000000000

Հիմա այս ֆունկցիան գրեմ մի ֆայլի մեջ, օրինակ, ex0.hs անունով, ու փորձեմ այդ ֆայլը թարգմանել Հասկելի կոմպիլյատորով։

-- Իմ առաջին ծրագիրը

factorial :: Integer -> Integer
factorial n = if n == 1 then 1 else n * factorial (n - 1)

Այստեղ ֆունկցիայի սահմանումից առաջ ավելացրել եմ նաև դրա վերնագիրը (կամ նկարագրությունը)։ Այդ նկարագրությամբ տրվում է ֆունկցիայի տիպը. :: սիմվոլից ձախ գրված է ֆունկցիայի անունը՝ factorial, իսկ աջ կողմում՝ արգումենտի ու վերադարձվող արժեքի տիպերը։ Այսինքն՝ ֆունկցիան ստանում է Integer տիպի արգումենտ և վերադարձնում է Integer տիպի արժեք։ Երկրորդ տողում հենց ֆունկցիայի սահմանումն է. = սիմվոլից ձախ ֆունկցիայի անունն ու արգումենտն է, իսկ աջ կողմում՝ մարմինը, որը տվյալ դեպքում պարզ ճյուղավորման արտահայտություն է։

Haskell Platform-ում կոմպիլյատորը ghc—ն է։ Աշխատեցնում եմ՝ մուտքին տալով ex0.hs ֆայլը.

$ ghc ex0.hs
[1 of 1] Compiling Main             ( ex0.hs, ex0.o )

ex0.hs:1:1: error:
    The IO action ‘main’ is not defined in module ‘Main’
  |
1 |
  | ^

Սխալի հաղորդագրությունն ասում է, որ Main մոդուլում սահմանված չէ main գործողությունը։ Բանից պարզվում է, որ Հասկելի կոմպիլյատորը նույնպես (ինչպես, օրինակ, Սի լեզվի կոմպիլյատորը) որպես մուտքի կետ է համարում main գործողությունը։ Հիմա ex0.hs ֆայլում ավելացնում եմ main գործողությունն այնպես, որ այն արտածի 12-ի ֆակտորիալը.

-- Իմ առաջին ծրագիրը
factorial n = if n == 1 then 1 else n * factorial (n - 1)

-- Մուտքի կետը
main =
    print (factorial 12)

Նորից փորձեմ թարգմանել։ Ի դեպ, Հասկել լզվում -- սիմվոլով սկսվում են մեկնաբանությունները։

$ ghc ex0.hs
[1 of 1] Compiling Main             ( ex0.hs, ex0.o )
Linking ex0 ...

Արդեն ամեն ինչ լավ է։ Իմ գրած ծրագիրը թարգմանվեց (compile), կապակցվեց (link), և հիմա կարող եմ աշխատեցնել ու տեսնել արդյունքը.

$ ./ex0
479001600

Բայց այս ծրագիրը կարողանում է հաշվել ու տպել միայն 12-ի ֆակտորիալը։ Իսկ ես ուզում եմ, որ այն կարողանա հաշվել հրամանային տողում տրված թվի ֆակտորիալը։ ՄԻ քիչ քչփորելուց հետո պարզեցի, որ Հասկել ծրագրում գրամանային տողի պարամետրերը կարելի է վերցնել System.Environment մոդուլի getArgs գործողությամբ։ Օրինակ, հետևյալ ծրագիրը (գրառված ex1.hs ֆայլում) արտածում է հրամանային տողում տրված պարամետրերի ցուցակը.

-- Հրամանային տողի պարամետրերի ցուցադրություն

import System.Environment

main = do
    args <- getArgs
    print args

Ահա թարգմանության ու կատարման մի քանի օրինակ.

$ ./ex1
[]
$ ./ex1 a
["a"]
$ ./ex1 a bb
["a","bb"]
$ ./ex1 a bb ccc
["a","bb","ccc"]
$ ./ex1 1 22 333
["1","22","333"]

Այստեղից երևում է, որ հրամանային տողի պարամետրերը ծրագրում երևում են տեքստային արժեքների ցուցակի տեսքով։ Ես պետք է թվի տեքստային ներկայացումից ստանամ դրա թվային արժեքը, ապա այդ արժեքի նկատմամբ կիրառեմ factorial ֆունկցիան:

Հասկելի read ֆուկցիան տեքսից «կարդում» է որևէ տիպի արժեք։ Այդ տիպը տրվում է ֆունկցիայի կանչի հետ՝ :: սիմվոլոլից հետո։ Օրինակ, «read "12" :: Int» արտահայտությունը "12" տողից կարդում է Int տիպի 12 արժեքը։ «read "12" :: Float» արտահայտությունը նույն տողից կարդում է 12.0 արժեքը՝ Float տիպի։

Այսպիսով, ես պետք է վերցնեմ հրամանային տողի պարամետրերի ցուցակի առաջին տարրը (head ֆունկցիայիով), դրա նկատմամբ կիրառեմ read ֆունկցիան՝ Integer տիպի համար, ստացված արժեքի նկատմամբ կիրառեմ factorial-ը ու տպեմ ստացված արժեքը։ Ահա այսպիսի մի արտահայտություն main ֆունկցիայում.

print (factorial (read (head args) :: Integer))

Ձևափոխված ex0.hs ծրագիրը կունենա հետևյալ վերջնական տեսքը.

import System.Environment

-- Ֆակտորիալի հաշվարկը
factorial :: Integer -> Integer
factorial n = 
    if n == 1 
    then 1
    else n * factorial (n - 1)

-- Մուտքի կետ
main :: IO ()
main = do
    args <- getArgs
    print (factorial (read (head args) :: Integer))

Լավ. տեսնենք, թե սա ինչպես է աշխատում։

$ ghc ex0.hs
[1 of 1] Compiling Main             ( ex0.hs, ex0.o )
Linking ex0 ...
$ ./ex0 2
2
$ ./ex0 12
479001600
$ ./ex0 20
2432902008176640000
$ ./ex0 40
815915283247897734345611269596115894272000000000

Լավ էլ աշխատում է։ Բայց, իհարկե, թերություններ կան։ Առաջին թերությունը տեխնիկական է. դիտարկված չէ այն դեպքը, երբ հրամանային տողում ոչինչ տրված չէ։ Օրինակ, եթե աշխատեցնեմ ծրագիրը՝ հրամանային տողում ոչինչ չտալով, ապա կստանամ հաղորդագրություն այն մասին, որ head ֆունկցիային տրված է դատարկ ցուցակ.

$ ./ex0
ex0: Prelude.head: empty list

Սա պետք է ուղղել՝ main գործողության մեջ պայման գրելով։ Այսպես.

main = do
    args <- getArgs
    if not (null args)
    then print (factorial (read (head args) :: Integer))
    else putStrLn "Ոչինչ տրված չէ։"

Հիմա եթե ծրագիրն աշխատեցնեմ դատարկ հրամանային տողով, ապա որպես պատասխան կստանամ «Ոչինչ տրված չէ։»։

Հաջորդիվ. թերևս Հասկել լեզվով գրող ոչ մի ծրագրավորող թվի ֆակտորիալը հաշվող ֆունկցիան չի գրի այնպես, ինչպես ես գրել եմ։ Վարպետ Հասկել-ծրագրավորողը պարզապես կգրի.

factorial :: Integer -> Integer
factorial n = product [1 .. n]

Եվ վերջ։ Այստեղ գրված է ֆակտորիալի բառացի սահմանումը՝ այն 1-ից n թվերի ([1 .. n]) արտադրյալն է (product):

Monday, April 6, 2020

Գրաֆի գագաթների տոպոլոգիական թվարկման մասին

Նախ նկարագրեմ ուղղորդված գրաֆի (directed graph, digraph) մոդելը որպես digraph դասի կաղապար։ Այս կաղապարի պարամետրն այն տիպն է, որ նմուշը գրառվելու է գրավի գագաթում։ Այդ տիպի վրա դրված մակ պահանջն այն է, որ նրա համար սահմանված լինի հավասարության ստուգման == գործողությունը։ Այդ գործողությունն օգտագործելու եմ տրված տվյալը պարունակող գագաթի ինդեքսը որոնելու համար։
template<typename Y>
class digraph {
    /// ...
};
Գրաֆի ներքին ներկայացման համար ընտրել եմ գագաթների հարևանության ցուցակների եղանակը։ Գագաթները հերթականությամբ ավելացնում եմ միաչափ զանգվածում (vector): Իսկ ամեն մի գագաթի (vertex) համապատասխանեցնում եմ նրան հարևան գագաթների ինդեքսների ցուցակը։ Քանի որ որոշել եմ գագաթում գրառել կաղապարի պարամետրով տրված ցանկացած տիպի օբյեկտ, մի գագաթի նկարագրությունը սահմանել եմ vertex տիպով.
using index = int;
using index_list = std::vector<index>;
using vertex = std::pair<Y,index_list>;
Դե իսկ գրաֆի գագաթների ցուցակն էլ արդեն կսահմանեմ հետևյալ կերպ.
std::vector<vertex> _vertices;
Գրաֆը կառուցելու եմ կողերը հաջորդաբար ավելացնելով։ add_edge մեթոդը ստանում է կաղապարի Y տիպի երկու արժեք և գրաֆում կոդ է ավելացնում այդ արժեքները պարունակող գագաթների միջև։ Եթե այդպիսի գագաթներ դեռ չկան, ապա գրաֆում ավելացնում է նաև գագաթները։
void add_vertex(const Y& u, const Y& v)
{
    auto ui = add_vertex(u);
    auto vi = add_vertex(v);
    _vertices[ui].second.push_back(vi);
}
Այստեղ օգտագործված add_vertex մեթոդը գրաֆում ավելացնում է տրված արժեքը պարունակող գագաթ։ Եթե այդպիսին արդեն կա, ապա վերադարձնում է դրա ինդեքսը։
index add_vertex(const Y& v)
{
    // որոնել
    for( index ix = 0; ix < _vertices.size(); ++ix )
        if( _vertices[ix].first == v )
            return ix;

    // ավելացնել
    _vertices.push_back(v, {});
    return _vertices.size() - 1;
}
Այսքանը լրիվ հերիք է գրաֆի կառուցման համար։ Թերևս կարելի է ավելացնել to_string մեթոդը, որը կվերադարձնի գրաֆի ինչ-որ տեքստային ներկայացում. պարզապես շտկումների համար։
std::string to_string()
{
    std::ostringstream oss;
    for( auto& e : _vertices ) {
        oss << e.first << " -> { ";
        for( auto& i : e.second )
            oss << _vertices[i].first << ' ';
        oss << '}' << std::endl;
    }
    return oss.str();
}
Այս մեթոդը պահանջում է, որ կաղապարի Y տիպի համար սահմանված լինի արտածման հոսքի մեջ ուղարկելու գործողությունը՝ operator<<։ Անցնեմ գրաֆի գագաթների տոպոլոգիական թվարկման իրականացմանը։ Տոպոլոգիական կարգավորման մասին բան չեմ գրի. կարելի է կարդալ, օրինակ, Ուիքիփեդիայի Topological Sorting էջը։ Միայն ասեմ, որ իրականացման համար ընտրել եմ Kahn-ի ալգորիթմը։ Մի քանի բառով դրա էությունը հետևյալն է. ամենասկզբում ստեկի մեջ են ավելացնում (push) բոլոր այն գագաթները, որոնք նախորդող չունեն (աղեղները դրանցից միայն դուրս են գալիս)։ Այնուհետև, քանի դեռ ստեկը դատարկ չէ, ստեկից հանում ենք u գագաթը, ապա գրաֆից հեռացնում ենք (pop) u գագաթից դուրս եկող բոլոր կողերը։ Եթե այս գործողության արդյունքում հայտնվում է գագաթ, որը դեպի իրեն եկող կող չունի, ապա այդ գագաթն ավելացնում ենք (push) ստեկում։ Քանի որ գրաֆից կող հեռացնելը կվնասեր մեր սկզբնական գրաֆը, այդ «կող հեռացնել» գործողությունը մոդելավորվում է մի վեկտորով, որում ամեն մի գագաթի համար պահվում է դեպի իրեն եկող կողերի քանակը։ Գրաֆի գագաթների՝ տոպոլոգիական կարգով թվարկումը իրականացրել եմ enumerate մեթոդում, որի պարամետրը ֆունկցիա է։ Այս ֆունկցիայով տրվում է այն գործողությունը, որը պետք է կատարվի գրաֆի թվարկվող հերթական գագաթի հետ։ Ավելի մանրամասն՝ մեկնաբանություններում.
void enumerate(std::function f)
{
    // գրաֆի գագաթների քանակը
    const std::size_t sz = _vertices.size();

    // degrees զանգվածում գրաֆի ամեն մի գագաթի համար
    // հաշվում ենք դեպի այն եկող կողերի քանակը
    std::vector<std::size_t> degrees(sz);
    for( auto& e : _vertices )
        for( auto& n : e.second )
            degrees[n] += 1;

    // նախապես S ստեկում ավելացնում ենք այն գագաթները,
    // որոնք նախորդող չունեն
    std::stack<index> S;
    for( std::size_t i = 0; i < degrees.size(); ++i )
        if( degrees[i] == 0 )
            S.push(i);

    // իտերացիա գագաթներով
    while( !S.empty() ) { // քանի դեռ ստեկը դատարկ չէ
        // վերցնել գագաթի տարրը
        index ix = S.top();
        S.pop();

        // տրված գործողությունը կատարել գագաթում գրառված
        // տվյալների հետ
        f(_vertices[ix].first);

        // դիտարկվող գագաթի բոլոր հարևանների համար...
        for( auto& vi : _vertices[ix].second ) {
            // ... եթե այդ հարևանը նախորդոնղեր չունի, ապա
            // այն արդեն մասնակցել է թվարկմանը, ...
            if( degrees[vi] == 0 )
                continue;

            // «կողը հեռացնելու» գործողության մոդելը.
            // պակասեցնում ենք հաշվիչը, ...
            degrees[vi] -= 1;
            // ... եթե հաշվիչը դառնում է զրո, ապա այդ գագաթը
            // ավելացնում ենք ստեկում
            if( degrees[vi] == 0 )
                S.push(vi);
        }
    }
}
Փորձարկենք ալգորիթմը ստորև բերված գրաֆի վրա՝ որպես թվարկման գործողություն տալով պարզապես գագաթի պարունակությունը տպող որևէ ֆունկցիա։
Սահմանում եմ գրաֆ, դրանում ավելացնում եմ նկարի գրաֆի կողերը, հետո to_string մեթոդով տպում եմ գրաֆի տեքստային ներկայացումը։ Թեսթավորման համար պարզապես ուզում եմ տպել գագաթները տոպոլոգիական կարգով։ Դրա համար enumerate մեթոդի արգումենտում տալիս եմ լամբդա-ֆունկցիա, որը պարզապես արտածում է իր արգումենտը։
int main()
{
    graphs::digraph<std::string> g0;
    g0.add_edge("a", "q0");
    g0.add_edge("b", "q0");
    g0.add_edge("b", "q1");
    g0.add_edge("c", "q1");
    g0.add_edge("q0", "x");
    g0.add_edge("q1", "x");
    g0.add_edge("q0", "y");
    g0.add_edge("q1", "y");

    std::cout << "Graph: " << std::endl << g0.to_string() << std::endl;

    std::cout << "Topological order of vertices: " << std::endl;
    g0.enumerate([&](auto& s) {std::cout << s << ' '; });
}
Կատարման արդյունքում արտածվում է հետևյալը.
Graph:
a -> { q0 }
q0 -> { x y }
b -> { q0 q1 }
q1 -> { x y }
c -> { q1 }
x -> { }
y -> { }

Topological order of vertices:
c b q1 a q0 y x
Լավ է։ Բայց ես ուզում եմ գրաֆի համար իրականացնել նրա գանաթերը տոպոլոգիական կարգով թվարկող իտերատոր. այնպիսին, ինչպիսիք սահմանված են STL-ում։ Այդ տիպի իտերատորի առկայության դեպքում կարող եմ գրել այսպիսի կոդ.
for( auto& v : g0 )
    std::cout << v << ' ';
Պարզ է, որ այդ իտերատորի մեթոդների իրականացումը պետք է արտացոլի նույն enumerate մեթոդի վարքը։ digraph դասում սահմանում եմ ներդրված iterator դասը։ range-for-ի աշխատանքն ապահովելու համար իտերատորում պետք է իրականացնել operator*, operator++ և operator!= գործողությունները։ Իտերատորի կոնստրուկտորում հաշվարկվում են բոլոր գագաթների մուտքային կիսաաստիճանները՝ տվյալ գագաթին ուղղված կողերի քանակը, ապա ստեկի մեջ են ավելացվում այն գագաթների ինդեքսները, դեպի որոնց եկող կողեր չկան։ operator*-ը վերադարձնում է հղում հերթական գագաթում գրառված տվյալին։ operator++-ը իտերատորը փոխանցում է հաջորդ գագաթին։ operator!=-ը համեմատում է երկու իտերատորների հերթական գագաթները։ Նորից՝ մանրամասները կոդի մեկնաբանություններում։
template
class digraph {
    // ...
    public:
        class iterator {
        public:
            using iterator_category = std::forward_iterator_tag;
            using value_type = Y;

            //
            iterator(const digraph& g, bool init)
                : _ref{g}
            {
                if( init ) {
                    // հաշվարկվում են մուտքային կիսաաստիճանները
                    _degrees.resize(_ref._vertices.size());
                    for( auto& e : _ref._vertices )
                        for( auto& n : e.second )
                            _degrees[n] += 1;

                    // ստեկում ավելացնել բոլոր «սկզբնական» գագաթների ինդեքսները
                    for( std::size_t i = 0; i < _degrees.size(); ++i )
                        if( _degrees[i] == 0 )
                            _S.push(i);

                    // կատարել առաջին քայլը՝ արժեքավորել դիտարկվող գագաթի ինդեքսը
                    this->operator++();
                }
            }

            //
            iterator& operator++()
            {
                // եթե ստեկը դատարկ չէ, ապա անցնել հերթական գագաթին, հակառակ
                // դեպքում հերթական գագաթի ինդեքսին վերագրել -1
                if( !_S.empty() ) {
                    _current = _S.top();
                    _S.pop();

                    for( auto& vi : _ref._vertices[_current].second ) {
                        if( _degrees[vi] == 0 )
                            continue;

                        _degrees[vi] -= 1;
                        if( _degrees[vi] == 0 )
                            _S.push(vi);
                    }
                }
                else
                    _current = -1;

                return *this;
            }

            //
            bool operator!=(const iterator& other)
            {
                // համեմատել երկու իտերատորներում ընթացիկ գագաթի ինդեքսը
                return _current != other._current;
            }

            //
            const value_type& operator*() const
            {
                // վերադարձնել ընթացիկ գագաթում պահվող տվյալը
                return _ref._vertices[_current].first;
            }

        private:
            const digraph& _ref; // հղում գրաֆին
            index _current = -1; // հերթական դիտարկվող գագաթի ինդեքսը
            std::vector<std::size_t> _degrees; // գագափթների մուտքային կիսաաստիճանները
            std::stack<index> _S; // ինդեքսների ստեկը
        };
};
Մնում է հիմա digraph դասի համար իրականացնել իտերատոր վերադարձնող begin և end մեթոդները։
iterator begin()
{
    return iterator(*this, true);
}

iterator end()
{
    return iterator(*this, false);
}
Իտերատորի բերված իրականացումը և digraph դասի begin և end մեթոդներն այն նվազագույնն են, որոնք ապահովում են range-for տիպի ցիկլի աշխատանքը։