Praktikum 4
Sõnetöötlus ja tekstiline sisend/väljund, list
Teemad
Klassid String
ja StringBuilder
, tekstifailidega suhtlemine. Listid, klass ArrayList
. Mähisklassid.
Pärast selle praktikumi läbimist üliõpilane
- teab, et
String
on viittüüp, mitte lihttüüp; - tunneb klassi
String
meetodeid ja oskab neid kasutada; - tunneb klassi
StringBuilder
meetodeid ja oskab neid kasutada; - oskab kasutada mähisklasse;
- oskab teksti kirjutada faili ja sealt lugeda;
- teab ühemõõtmelise massiivi ja listi erinevusi;
- oskab listi erineval moel luua ja selle elementidele uusi väärtusi anda;
- tunneb klassi
ArrayList
meetodeid ja oskab neid kasutada.
Automaatkontrollist ja Java failide kodeeringust
Seekord on Moodle'is osade koduülesannete jaoks olemas automaatkontrollid, mis annavad lahenduse kohta esmase tagasiside. Lehekülje lõpus on selle kohta rohkem juttu, aga enne programmeerima hakkamist tuleks Eclipse'i kasutajatel vaadata üle enda projekti seaded.
Automaatkontrolli puhul on mõistlik kokku leppida, et esitatavad Java failid on kindlas kodeeringus, siis ei teki kahetimõistetavust, kuidas failide baite tõlgendada. Selle kursuse automaattestid eeldavad, et failid on UTF-8 kodeeringus.
Automaatkontrolliga hästi läbisaamiseks palun kontrolli kohe praegu, et su IDE oleks seadistatud õiget kodeeringut kasutama. Juhend selle jaoks on siin.
Automaatkontrollist ja Java klasside pakettidest
Selleks, et automaatkontroll esitatud klassid kindlalt üles leiaks, peab see teadma, millistes pakettides klassid asuvad. Kuna selles kursuses pole veel pakettidest räägitud, siis on praegu kõige mõistlikum leppida kokku, et klassid asuvad vaikepaketis, st. vastavad Java failid asuvad otse koodi juurkaustas (enamasti on selle kausta nimi "src") ja failide alguses ei ole package
direktiivi.
Absoluutsed ja suhtelised failiteed. Jooksev kaust.
Kuna nüüd peate oma ülesanded tööle saama vähemalt kahes arvutis (teie enda arvuti ja Moodle'i testserver), on põhjust rääkida täpsemalt failidele viitamisest.
Failidele saab viidata kahel moel.
Kõige konkreetsem viitamisviis on absoluutne tee (ingl.k absolute path), nt. C:\Users\Frederico\projektid\OOP\nädal1\nimed.txt
või /home/frederico/projektid/OOP/nädal1/nimed.txt
. Sellise viitamisviisi puhul on alati selge, millist konkreetset faili mõeldakse. Seesama konkreetsus on aga ka selle viisi puuduseks -- mõnikord soovime failile viidata kaudsemalt. Näiteks kui meie programm vajab mingit nimede faili ja me soovime, et meie programmi saaks kasutada ka teises arvutis, ei ole mõistlik nõuda, et teises arvutis peaks olema kindlasti kaust C:\Users\Frederico
.
Lahendus on kasutada suhtelist failiteed (ingl.k relative path), nt. nimed.txt
või data\nimed.txt
või blaa/blaa/data/nimed.txt
. Sel juhul on viide failile antud mingi kausta suhtes, enamasti jooksva kausta (ingl.k current directory) suhtes. OP-süsteemi igal protsessil on konkreetsel hetkel mingi kaust valitud jooksvaks kaustaks, ja selles kaustas olevaid failidele ja alamkaustadele saab kergesti viidata suhtelise teega.
Kui öeldakse, et programm loeb midagi failist nimed.txt
, siis tuleb märgata, et tegemist on suhtelise teega ja et programmis tulebki kirjutada new File("nimed.txt")
vms. (mitte new File("C:\\Users\\Frederico\\projektid\\OOP\\nädal1\\nimed.txt")
). Sellise programmi testimisel tuleks korraldada nii, et fail nimed.txt
asuks programmi jooksvas kaustas. Nii IntelliJ kui Eclipse'i kaudu klassi käivitades on jooksvaks kaustaks vaikimisi projekti juurkaust, seega tuleks nimed.txt
salvestada projekti juurkausta (st. alamkausta src
kõrvale, mitte sisse). Käsurealt käivitades on jooksvaks kaustaks see kaust, kus ollakse java
käsu käivitamise hetkel.
Sõned
Erinevalt arvutüüpidest (täisarvutüübid int
, byte
, short
, long
ja reaalarvutüübid double
, float
), loogilisest tüübist (boolean
) ja sümboltüübist (char
) pole sõnetüüp keeles Java algtüüp, vaid iga sõne on klassi String
isend. Kui vaataksime näiteks Java API-st
, siis näeme, et klassi String
isendi loomiseks on võimalik kasutada üle kümne erineva konstruktori. Näiteks on nende hulgas konstruktor, mis nõuab argumendiks sümbolite massiivi.
char[] sümboliteMassiiv = {'T','e','r','e',' ','h','o','m','m','i','k','u','s','t'}; String teade = new String(sümboliteMassiiv); System.out.println(teade);
On aga ka lihtsam viis klassi String
isendi loomiseks, nimelt kiirloome sõneliteraali abil:
String teade = "Tere hommikust";
(Literaal on konkreetse väärtuse üleskirjutus programmis. Väärtuse tüüp on määratud kirjakujuga, nt. 15 on int
-tüüpi, 15L aga long
-tüüpi. Sõneliteraali tähistavad jutumärgid (ülakomad tähistavad Java-s (erinevalt Python-ist) sümbolit, ehk char
-tüüpi). Kui sõneliteraali sees on vaja jutumärke kasutada, siis saab seda teha langkriipsu abil, nt "\""
.)
Edasi, kui klassi String
isend on loodud, saab kasutada klassis String
defineeritud isendimeetodeid, näiteks length
, toLowerCase
jne. Nagu eelmises praktikumis õppisime, kasutatakse isendimeetodit koos konkreetse isendiga. Isendi nimi ja meetodi nimi ühendatakse punktiga, näiteks sõne teade
pikkus leitakse järgmiselt:
teade.length()
Järgnev näiteprogramm demonstreerib klassi String
meetodeid. Pange tähele, et sõne sümbolite nummerdamine algab nullist (analoogiliselt massiiviindeksiga). Leidke nende meetodite täpsed kirjeldused Java API-st
. Pöörake tähelepanu meetodi signatuurile (eriti parameetrite arvule ja nende tüüpidele) ning tagastustüübile. Tutvuge API-s ka teiste klassi String
meetoditega.
public class TestString { public static void main(String[] args) { String nimi = "Mart Mardikas"; System.out.println("Sõne pikkus on: " + nimi.length()); // 13 System.out.println(nimi.startsWith("Mart")); // true System.out.println(nimi.endsWith("kas")); // true System.out.println(nimi.endsWith("Mart")); // false System.out.println("'a' esimene positsioon: " + nimi.indexOf('a')); // 1 int rIndex = nimi.indexOf('r'); System.out.println("'r' esimene positsioon: " + rIndex); // 2 System.out.println("'r' jargmine positsioon: " + nimi.indexOf('r', rIndex + 1)); // 7 int aIndex = nimi.lastIndexOf('a'); System.out.println("'a' viimane positsioon: " + aIndex); // 11 System.out.println("Alamsõne \\"Mardi\\" algus: " + nimi.indexOf("Mardi")); // 5 System.out.println("4. täht on "+nimi.charAt(3)); // 't' //Täpne võrdsuse kontroll: System.out.println(nimi.equals("Mart Mardikas")); // true System.out.println(nimi.equals("mart mardikas")); // false //Suuri-väikesi tähti mitteeristav võrdsuse kontroll: System.out.println(nimi.equalsIgnoreCase("mart mardikas")); // true //Leksikograafiline võrdlemine: System.out.println(nimi.compareTo("Jaan Jaaniste")); // >0 System.out.println(nimi.compareTo("Peeter Paan")); // <0 System.out.println(nimi.compareTo("Mart Mardikas")); // =0 System.out.println(nimi.replace('M', 'P')); // "Part Pardikas" System.out.println(nimi.toUpperCase()); // "MART MARDIKAS" //Sõne ilma alguses ja lõpus olevate tühikute ja reavahetusteta String imelik = " Mart \n"; System.out.println(imelik.trim()); // "Mart" } }
Ülesanne 1
Kompileerige ja käivitage klass TestString
. Lisa sinna rida, mis prindib välja
"Harry Potter ja 'saladuste' kamber"
(prindi jutumärgid ja ülakomad, nagu nad siin näha on).
Sõnede tükeldamine
Üsna sageli on vaja sõnesid tükeldada. Selleks on mitu võimalust (nt. klass StringTokenizer
). Siin praktikumis kasutame tükeldamiseks klassi String
isendimeetodit split
. Selle meetodi tagastustüübiks on String[]
, mis tähendab, et tulemuseks saadakse sõnede massiiv. Argumendiks on regulaaravaldis, mis määrab, milliseid sümboleid lugeda eraldajateks. Järgmises näites on eraldajaks tühik
String[] tükid = nimi.split(" "); for (int i = 0; i<tükid.length; i++) System.out.println(tükid[i]);
Antud juhul saaksime siis ekraanile
Mart Mardikas
Kui aga määrata eraldajaks täht "a"
String[] tükid = nimi.split("a"); // { "M", "rt M", "rdik", "s" }
Eraldaja ei pea alati ühesümboline olema, saab kasutada ka pikemaid eraldajaid. Kui näiteks määrata eraldajaks "ar"
String[] tükid = nimi.split("ar"); // { "M", "t M", "dikas" }
Nagu mainitud, on split
meetodi argumendiks regulaaravaldis - sõne, kus teatud sümbolitel on eritähendus, mis võimaldab kirja panna keerulisemaid eraldajaid. Regulaaravaldistest ei hakka me siin kursusel rääkima. Küll aga võiks meelde jätta, et kui split
meetod jagab su sõne imelikest kohtadest tükkideks, oled ilmselt kasutanud mõnda eritähendusega sümbolit (nt punkt ja erinevad sulud).
Ülesanne 2 (kontroll)
Võtke sõnena kasutusele üks lause, milles on vähemalt 7 sõna. Koostage programm klassis SõnadeAnalüüs
, mis leiab kõik lauses esinevad sõnad ja mõõdab, kui pikad need on. Ekraanile peab väljastatama alglause ning sõnad ja nende pikkused.
Kui olete juba hulk aega proovinud ülesannet iseseisvalt lahendada ja see ikka ei õnnestu, siis võib-olla saate abi murelahendajalt
. Püütud on tüüpilisemaid probleemseid kohti selgitada ja anda vihjeid.
Sõnede võrdlus
Ülaltoodud meetodite hulgas on mitmeid, mis kaht klassi String
isendit omavahel võrdlevad. Võrduse kontrolliks saab kasutada meetodit equals
. Miks ei võiks kahe isendi võrdust aga kontrollida märgipaari ==
abil nagu arvude võrduse kontrollimiseks? Tegelikult ongi märgipaar ==
täiesti lubatud ja kompileerimisel veateadet ei tule. Mure allikas on selles, et võrdusmärkide puhul võrreldakse isendite viitasid, aga meetod equals
arvestab isendite sisu. Olukorra selgitamiseks loome kolm sõne, esimese sümbolimassiivi ja kaks ülejäänut sõneliteraali abil.
char[] sümboliteMassiiv = {'T','e','r','e'}; String teade1 = new String(sümboliteMassiiv); String teade2 = "Tere"; String teade3 = "Tere";
Püüdke ennustada, millised väärtused väljastatakse, kui kasutame järgmisi võrdlusi.
System.out.println(teade1.equals(teade2)); System.out.println(teade2.equals(teade3)); System.out.println(teade1 == teade2); System.out.println(teade2 == teade3);
Ülesanne 3
Proovige nüüd eeltoodud võrdlemise näited läbi ja kontrollige oma ennustusi.
Täpsustavalt saab öelda, et kuna sõne on Javas muutmatu ja sageli kasutatav, siis JVM (Java virtuaalmasin) säästab mälu ja kasvatab jõudlust sellega, et paneb kiirloome abil sama sõneliteraaliga loodud klassi String
isendid ühte. Seda sõne nimetatakse kanooniliseks sõneks. Nii ongi viitade mõttes teade2
ja teade3
võrdsed, aga teade1
nendega mitte. Sisu mõttes on aga kõik kolm võrdsed. Kuna tavaliselt on meil just sisu mõttes võrdsust vaja kontrollida, siis kasutamegi meetodit equals
.
Klass StringBuilder
Eespool nägime palju meetodeid, mida saab rakendada klassi String
isendi puhul. Tähtis on aga silmas pidada, et need meetodid ei muuda isendit ennast. Sõne on Javas muutumatu – tema sisu ei saa muuta. Ka näiteks read
String s = "Soome"; s = "Poola";
ei muuda sõne s
sisu. Esimene rida loob isendi, mille sisuks on "Soome"
ja omistab selle viida s
-ile. Teine rida loob isendi, mille sisuks on "Poola"
ja omistab selle viida s
-ile. Esimene objekt jääb tegelikult (vähemalt esialgu) alles (ega muutu), aga tema poole ei saa enam pöörduda.
Võime öelda, et klass String
käsitleb sõne staatiliselt. Kui aga tahame sõne dünaamiliselt käsitleda (nt. muuta), siis on sobiv klass StringBuilder
.
Klassis StringBuilder
(vt. API
) on neli konstruktorit, millest meie vaatleme kolme. Parameetriteta konstuktori abil moodustub klassi StringBuilder
isend, milles on kohti 16 sümboli jaoks, aga ühtegi sümbolit (esialgu) pole. Kui isendi loomisel anda ette täisarv, siis tekibki kohti niipaljude sümbolite jaoks. Kui argumendiks on sõne, siis vastava sõne sümbolid "puhvrisse" pannaksegi.
StringBuilder() StringBuilder(int) StringBuilder(String)
Meetodeid on mõnikümmend, mitmed neist on korduva nimega. Meie jaoks olulisemad on
append
(lõppu lisamine, suurendab vajadusel automaatselt puhvrit)capacity
(maht)charAt
(sümbol vastaval kohal)delete
(kustutamine)insert
(lisamine vastavale kohale)length
(pikkus)setCharAt
(sümboli asendamine vastaval kohal)setLength
(pikkuse muutmine)indexOf
(otsimine)toString
(sõneks teisendamine)replace
(asendamine)reverse
(transponeerimine)
Kõige tavalisem kasutus klassile StringBuilder
on sõnede jupp haaval koostamine, näiteks nii:
int[] arvud = { 3, 5, 7, 11 }; StringBuilder sb = new StringBuilder(50); // küsime 50 tähemärgi jagu puhvrit sb.append("esimesed algarvud on "); for (int arv : arvud) { sb.append(arv); sb.append(' '); } String tulemus = sb.toString();
Täpselt sama tulemus on ka järgneval koodil:
String tulemus = "esimesed algarvud on "; for (int arv : arvud) { tulemus = tulemus + arv + ' '; }
Miks siis klassi StringBuilder
kasutada? Sõnede liitmist pole tegelikult olemas - see on ainult mugav süntaks, et kasutada klassi StringBuilder
, mis oskab char
-massiive ringi kopeerida. Kompilaator teisendab salaja eelneva koodi niisuguseks:
String tulemus = "esimesed algarvud on "; for (int arv : arvud) { StringBuilder sb = new StringBuilder(); sb.append(tulemus); sb.append(arv); sb.append(' '); tulemus = sb.toString(); }
Kui täpsemalt vaadata, on näha, et kompilaator ei ole kuigi tark ja teeb vahetulemusest päris mitu ebavajalikku koopiat (meie algne kood on efektiivsem). Lisaks võimaldab StringBuilder
erinevaid trikke teha, nt mugavalt sõne ümber pöörata või seal efektiivselt muudatusi teha. Näiteks saame asendada kõik tühikud komaga, ignoreerides algust:
StringBuilder sb = new StringBuilder("esimesed algarvud on 3 5 7 11"); int i = sb.indexOf(" ", "esimesed algarvud on ".length()); // tühik pärast “3” while (i != -1) { sb.replace(i, i + 1, ","); i = sb.indexOf(" ", i + 1); } System.out.println(sb); // “esimesed algarvud on 3,5,7,11”
Ülesanne 4
Katsetage klassi StringBuilder
meetodeid ja vahetulemuste nägemiseks lisage sobivatesse kohtadesse rida System.out.println(sb);
Mähisklassid
Selleks, et jõudlust paremal tasemel hoida, ei käsitleta algtüüpi suurusi Javas objektidena. Samas nõuavad paljud meetodid siiski argumentidena objekte. Sellisel puhul saame kasutada mähisklasse (wrapper class). Algtüüpidele vastavad mähisklassid on Boolean
, Character
, Double
, Float
, Byte
, Short
, Integer
ja Long
. Neis kõigis on meetodid doubleValue
, floatValue
, intValue
, longValue
, shortValue
ja byteValue
, mis tagastavad vastavat algtüüpi väärtuse. Igas arvulises mähisklassis on üks konstruktor, mis nõuab argumendiks vastavat algtüüpi suurust ja teine, mis nõuab argumendiks sõnet.
Integer intObjekt1 = new Integer(15); Integer intObjekt2 = new Integer("17"); int arvint2 = intObjekt2.intValue(); double arvdouble2 = intObjekt2.doubleValue(); System.out.println(arvdouble2);
Arvulistes mähisklassides on ka konstandid MAX_VALUE
ja MIN_VALUE
, mis kujutavad vastava algtüübi maksimaalseid ja minimaalseid väärtusi. Täisarvuliste tüüpide puhul on MIN_VALUE
üldse minimaalne arv, Float
ja Double
korral minimaalne positiivne arv.
System.out.println(Double.MIN_VALUE); System.out.println(Byte.MAX_VALUE);
Igas arvulises mähisklassis on staatiline meetod valueOf
, mis loob uue objekti sõne põhjal.
Integer intObjekt3 = Integer.valueOf("19");
Sõne põhjal saab luua algtüüpi suurusi ka vastavate parsimismeetoditega, millele täisarvude puhul saab näidata ka arvusüsteemi aluse.
double arvdouble4 = Double.parseDouble("21"); int arvint4 = Integer.parseInt("1CE",16);
Ülesanne 5
Vaadake Java APIst
mähisklasside infot ja uurige erinevaid meetodeid, konstante. Näiteks seda, kuidas on korraldatud töö lõpmatustega.
Tekstiline sisend/väljund (I/O)
Päris mitmes praktikumis oleme põgusalt vaadanud, kuidas saada kasutajalt programmi töö alustamisel või käigus informatsiooni. Vaatluse all on olnud käsurealt programmi käivitamisel sõnemassiivina saadavad argumendid (2. praktikum
), klassi Scanner
abil klaviatuurilt saadavad väärtused (1. praktikum
) ja klassi JOptionPane
abil korralduv dialoog (1. rühmatöö juhend
). Käesolevas lõigus püüame andmed saada kätte tekstifailist ja tekstifaili ka kirjutada.
Failidega suhtlemise saab Javas korraldada mitmeti. Siinkohal toome vaid ühe võimaluse. Kõigepealt püüame määrata, millise failiga suhtlemine käib. Selleks loome klassi java.io.File
isendi.
java.io.File fail = new java.io.File("c:/temp/marsruut.txt");
Kasutada saab mitmesuguseid meetodeid (vt. API
), millest hetkel vaatleme meetodit exists
, mille abil saame teada, kas antud fail eksisteerib või mitte.
if (fail.exists()) System.out.println("Fail on juba olemas"); else System.out.println("Faili ei ole olemas");
Püüame nüüd sinna faili midagi kirjutada. Selleks loome klassi java.io.PrintWriter
isendi. Selles klassis on mitmeid konstruktoreid (vt. API
), meie kasutame seda, mille argumendiks on fail. (Võite proovida ka varianti, kus argumendiks on failinimi sõnena.)
try (java.io.PrintWriter pw = new java.io.PrintWriter(fail, "UTF-8")) { // kood, mis kasutab faili }
try
on uus märksõna, mis vajab täiendavat seletust. Failide (ja võrguühenduste) kasutamiseks peab operatsioonisüsteemi kaudu vastavad failid avama (OS haldab sisemiselt lugemise/kirjutamise järjehoidjaid, puhvreid jne). Pärast failidega töötamise lõpetamist peab need sulgema, et OS saaks kasutatud vahendid uuesti vabastada. Ülal kasutatud süntaksi, kus ressurssi (antud juhul faili) avamine toimub võtmesõna try
järel sulgudes, nimetatakse try-with-resources. Seda kasutades saab tagada, et ressurss saab try
ploki lõpus alati korrektselt suletud.
Try-with-resources süntaksi peab kasutama igal pool, kus avatakse faile. Faile on võimalik ka close
meetodit kasutades käsitsi sulgeda, aga see variant ei tööta veaolukordades korrektselt (sellest täpsemalt 10. praktikumis). Seetõttu nõuame ka kontrolltöös try-with-resources (ja mitte close
) kasutamist.
Faili avamise koodi lisamisel tekib lisaks veateade, mis räägib käsitlemata erindist (unhandled exception). Erinditest tuleb hiljem eraldi praktikum, siinkohal lahendame olukorra lihtsalt peameetodi päisele kahe sõna lisamisega.
public static void main(String[] args) throws Exception
Klassis PrintWriter
on mitmeid meetodeid, sealhulgas ka meile tuttavad print
ja println
, mida nüüd kasutamegi.
try (java.io.PrintWriter pw = new java.io.PrintWriter(fail, "UTF-8")) { pw.print("Karl Ernst von Baeri "); pw.println("tänav"); pw.print("Johann Wilhelm Friedrich Hezeli "); pw.println("tänav"); pw.print("Juhan Liivi "); pw.println("tänav"); }
Kas teate, kus need tänavad Tartus asuvad? Hezeli tänav sai oma nime alles 22. veebruaril 2012.
Ülesanne 6
Püüdke ülaltoodud programmilõikude abil vastav fail luua. Vaadake mingi tekstiredaktoriga, kas fail tõesti loodetud kujul täitus.
Teksti kodeering (character encoding)
Arvutis teksti esitamiseks määratakse igale tähemärgile kindel numbriline väärtus. Eesti tähestikus on neid piisavalt vähe, et üks bait (võimaldab 256 erinevat väärtust) suudab esitada ükskõik millist eesti tähemärki. Ajalooliselt ongi enamus tekstifaile koostatud nii, et üks bait tähistab ühte tähemärki.
Probleem tekib siis, kui võtta kasutusse ka teised tähestikud, nt jaapani, hiina ja araabia tähestikud - tähti on liiga palju, et üks bait suudaks neid kõiki esitada. Ajalooliselt on kasutatud lahendusena kooditabeleid, nii üks number võib sõltuvalt kooditabelist tähendada erinevaid tähemärke. Tänapäeval kasutatakse erilist kooditabelit UTF-8, mis suudab esitada kõiki tähemärke, aga üks tähemärk võib võtta ruumi mitu baiti. Iga kord, kui sa tahad oma programmis faili kirjutada või lugeda, siis tuleb sul määrata ka kooditabel, mida kodeerimisel kasutada. Eelista UTF-8.
Kui täpitähed loetakse vigaselt sisse, siis järelikult salvestati fail mingit ajaloolist kodeeringut kasutades või sa üritad UTF-8 kodeeringus faili vale kooditabeliga lugeda. Lisalugemine kodeeringute kohta: artikkel.
Failist lugemiseks kasutame klassi Scanner
(kasutasime seda tegelikult juba ka 1. praktikumis klaviatuurilt lugemiseks). Isendi konstrueerimisel saab ette anda faili.
try (java.util.Scanner sc = new java.util.Scanner(fail, "UTF-8")) { // kood, mis kasutab faili }
Kasutades meetodeid hasNextLine
(mis kontrollib, kas on veel võtta ridu) ja nextLine
(mis võtab järgmise rea) loeb järgmine programmilõik failist andmeid ja väljastab need ekraanil nii, et eesnimed jäävad ära.
while (sc.hasNextLine()) { String rida = sc.nextLine(); String[] tükid = rida.split(" "); System.out.print(tükid[tükid.length-2]+" "+tükid[tükid.length-1]); System.out.println(); }
Analoogilisi meetodeid on teisigi. Näiteks lekseemide (token) jaoks on hasNext
(mis kontrollib, kas on veel võtta lekseeme) ja next
(mis võtab järgmise lekseemi). Vt. ka API
.
Pakettide nimede igakordse mainimise asemel võib ka vastavad paketid importida, kirjutades programmi algusesse nt.
import java.util.Scanner; import java.io.PrintWriter; import java.io.File;
Siis võib
try (java.util.Scanner sc = new java.util.Scanner(fail, "UTF-8")) { }
asemel kirjutada
try (Scanner sc = new Scanner(fail, "UTF-8")) { }
Failist saadud elemendid on sõned. Kui tahame neid kasutada näiteks täisarvudena või reaalarvudena, peame neid enne teisendama. Selleks saab kasutada vastavates mähisklassides olevaid meetodeid. Näiteks sõne täisarvuks teisendamisel on kasutatav meetod Integer.parseInt
, mille argumendiks tulebki sõne anda. Näiteks oletame, et kui failis on igal real reaalarv (sõnena), siis
double arv = Double.parseDouble(tükid[0]);
muudab selle double
-tüüpi arvuks, millega saame tehteid teha.
Ülesanne 7 (kontroll)
Failis nimed.txt on inimeste nimed, näiteks
Aadu Suur Mari Sale Blond Mari-Liis Maasikas Timothy Henry Charles Tamm
Eeldame, et iga nimi koosneb eesnimedest (neid võib olla mitu) ja perekonnanimest (viimane sõna). Eesnimi võib sisaldada ka sidekriipsu.
Kirjutada programm klassis Lühendaja
, mis väljastab ekraanile kõigi inimeste nimed kujul perekonnanimi ja eesnimede esimesed tähed koos punktiga ja tühikuga. Kui eesnimes on sidekriips, säilib see ka eesnimelühendis ja punkt sel juhul ainult teise eesnime tähe järel.
Näiteks ülaltoodud faili puhul ilmub ekraanile
Suur A. Blond M. S. Maasikas M-L. Tamm T. H. C.
Lisa 1 (vabatahtlik)
Proovi lahendada ülesanne nii, et klassi Lühendaja
oleks võimalik kasutada ka sedasi:
System.out.println(Lühendaja.lühenda("Mari Sale Blond")); // Väljastab Blond M. S.
Lisa 2 (vabatahtlik)
Proovi lahendada ülesanne nii, et kasutatav nimede fail oleks võimalik Lühendaja
-le käsureal ette anda. Seejuures peaks siiski toimima ka ilma käsurea parameetrita käivitamine -- sel juhul tuleks kasutada vaikimisi failinime nimed.txt (teisti öeldes: java Lühendaja
peaks andma sama tulemuse nagu java Lühendaja nimed.txt
).
Kui olete juba hulk aega proovinud ülesannet iseseisvalt lahendada ja see ikka ei õnnestu, siis võib-olla saate abi murelahendajalt
. Püütud on tüüpilisemaid probleemseid kohti selgitada ja anda vihjeid.
Listid
Lisaks massiivile on ka teisi andmestruktuure, mis võimaldavad erinevate elementide koos käsitlemist. Tegelikult ongi massiiv Javas suhteliselt paindumatu ja paljude ülesannete puhul sobimatu. Üheks võimaluseks on kasutada listi. Listis on elemendid teatud järjestuses. Põhilise erinevusena massiivist saab listi pikkust programmi töö käigus vabalt muuta, elemente saab erinevatesse kohtadesse lisada ja neid eemaldada. List on Javas seega dünaamiline andmestruktuur, massiiv aga staatiline andmestruktuur.
Geneerilised tüübid
Liste läheb vaja erinevat tüüpi objektide hoidmiseks. Sarnaselt massiividele hoiab ka iga Listi isend ainult ühte tüüpi andmeid. Java on staatiliste tüüpidega keel - kõik tüübid peab kompilaatorile teatavaks tegema - ja seda ka Listide osas. Seda ideed viivadki ellu geneerilised klassid, kus tüübimuutuja(te) abil saame vajalikud määramised teha. Näiteks ArrayList<Integer>
on mõeldud täisarvudele ja ArrayList<String>
sõnedele.
NB! Geneerilised tüübid ei suuda primitiive (nt. int, boolean, char) väljendada, nende asemel tuleb kasutada vastavaid mähisklasse (nt. Integer, Boolean, Character).
Geneerilised tüübid (e geneerikud) on Javas alates versioonist 1.5 (väljalase aastal 2004). Nii kohtab ka koodi, kus listi tüüpi (nt. ArrayList
) on kasutatud ilma täpsustava tüübiparameetrita. Taolisi tüüpe nimetatakse tooreteks (raw). Nende kasutamise korral on programmeerija ülesanne pidada meeles, mis tüüpi objektid kogumis on, Java arvates on sel juhul elementide tüüp Object
. Siin kursusel ei tohiks mitte ühegi ülesande juures tooreid tüüpe kasutada. Et tüübiparameetrite lisamine ei ununeks, seadista kohe praegu oma IDE hoiatust näitama, kui tüübiparameetrid puudu on (juhend siin).
Hea ülevaade
geneerikutest on Java veebilehestikus.
Klass ArrayList
Liste on võimalik realiseerida erineval moel. Siin kasutame klassi ArrayList
. Nii seda kui teisi dünaamilisi andmestruktuure käsitleme põhjalikumalt semestri teisel poolel. Praegu lihtsalt kasutame paindlikumaid võimalusi kui pakuks massiiv.
Näide:
import java.util.ArrayList; ... ArrayList<Integer> list1 = new ArrayList<>();
Põhilised toimingud, mida saab listiga teha:
- elemendi võtmine indeksi järgi, nt.
list.get(2)
(NB! indeksid algavad 0-st) - elemendi lisamine listi lõppu (
list.add(780)
) või määratud positsioonile (list.add(3, 780)
) - mitme elemendi lisamine (
list.addAll(mingiTeineList)
) - elemendi eemaldamine indeksi järgi (
list.remove(3)
) - sisalduvuse kontroll (
list.contains(780)
) - sisalduvuse kontroll koos indeksi tagastamisega (
list.indexOf(780)
) - pikkuse küsimine (
list.size()
)
Näide - listi koostamine
import java.util.ArrayList; ... ArrayList<Integer> list1 = new ArrayList<>(); list1.add(1); list1.add(2); list1.add(3);
Alternatiivne variant sama tulemuse jaoks:
import java.util.ArrayList; import java.util.Arrays; ... ArrayList<Integer> list2 = new ArrayList<>(); list2.addAll(Arrays.asList(1,2,3));
Näide - listi väljastamine ekraanile
Erinevalt massiivist ei pea (aga võib) listi väljastamiseks kasutada tsüklit:
import java.util.ArrayList; import java.util.Arrays; ... ArrayList<Integer> list1 = new ArrayList<>(); list1.add(1); list1.add(2); list1.add(3); System.out.println(list1); ArrayList<Integer> list2 = new ArrayList<>(); list2.addAll(Arrays.asList(1,2,3)); for (int i = 0; i < list2.size(); i++) System.out.print(list2.get(i)+" "); System.out.println();
Alates Java 8. versioonist on võimalik kasutada listi elementide puhul ka konstruktsiooni forEach. Kes sellest võimalusest rohkem tahab teada, võib vaadata APIst
.
Näide - listi ümberpööramine
Järgnev on näide meetodist:
public static ArrayList<Integer> reverse(ArrayList<Integer> list) { ArrayList<Integer> tulemus = new ArrayList<>(); for (int i = list.size()-1; i >= 0; i--) { tulemus.add(list.get(i)); } return tulemus; }
Kasutada võime seda meetodit nt. järgmiselt:
ArrayList<Integer> intList = new ArrayList<>(); intList.addAll(Arrays.asList(1,2,3)); System.out.println(reverse(intList));
Näide - elemendi lisamine listi keskele
ArrayList<Integer> list3 = new ArrayList<>(); list3.addAll(Arrays.asList(1,2,3)); list3.add(2, 54); // '54' saab 3. elemendiks (indeksiga 2) System.out.println(list3);
Ülesanne 8 (kontroll)
Lapsehoidmisfirmal on hulk lapsehoidjaid, mille nimekiri on failis järgmisel kujul:
1 Mary 1982 534123456 Tartu 2,5 2 Sokk 1985 534765432 Tallinn 6 30 Maria 1994 534191919 Tallinn 1,5 41 Jane 1960 534333444 Rakvere 25
Failis on igal real ühe lapsehoidja andmed vastavas järjekorras: lapsehoidja firmasisene number, nimi, sünniaasta, telefoninumber, asukoht ja lõpuks lapsehoidmiskogemust aastates. Firmasisesed numbrid ei pruugi olla järjestikused, aga on kasvavas järjekorras.
Koostada klass Lapsehoidja
, milles on privaatsed isendiväljad lapsehoidja firmasisese numbri (int
) ja lapsehoidja nime (String
) jaoks. Klassis on konstruktor, get
-meetodid ning meetod toString
.
Kirjutada programm klassis Lastehoid
, mis loeb failist nimega lapsehoidjad.txt (kodeering UTF-8, formaat nagu ülalpool näidatud) lapsehoidjate andmed ja loob listi, milles on faili ridadele vastavad klassi Lapsehoidja
isendid.
Lisada lapsehoidja, kelle firmasisene number on 35 ja nimeks on Jana, listi õigesse kohta (nii et firmasisesed numbrid jääksid kasvavasse järjekorda).
Kontrollida, kas on olemas lapsehoidja, kelle firmasisene number on 46. Kui on olemas, siis kustutada ta listist.
Väljastada lapsehoidjate andmed eraldi ridadele kujul <nr> <nimi>
. Ülaltoodud näitefaili korral peaks ekraanile ilmuma:
1 Mary 2 Sokk 30 Maria 35 Jana 41 Jane
Lapsehoidjate arv failis ei ole teada (programm peaks töötama suvalise (ka tühja) failiga).
Näiteandmete fail on aadressil http://kodu.ut.ee/~marinai/lapsehoidjad.txt
. Kopeerige see oma arvutisse.
Lihtsustus
Kui jääte klassiga Lapsehoidja
või lapsehoidjate listiga (ArrayList<Lapsehoidja>
) hätta, siis proovige lahendada ülesanne kahe lihtsama listiga: üks lapsehoidjate numbrite jaoks (ArrayList<Integer>
) ja teine nimede jaoks (ArrayList<String>
).
Kui olete juba hulk aega proovinud ülesannet iseseisvalt lahendada ja see ikka ei õnnestu, siis võib-olla saate abi murelahendajalt
. Püütud on tüüpilisemaid probleemseid kohti selgitada ja anda vihjeid.
Klass HashMap
Javas on suur hulk sisseehitatud andmestruktuure. Nendest tuleb täpsemalt juttu kursuse teises pooles. Lisaks listile mainime siin ka ära klassi HashMap
, mis on analoogne pythoni dict() struktuurile. Seda esimeses kontrolltöös ei küsita, aga võibolla on rühmatöös abiks:
// esimene geneeriline parameeter on võtme tüüp, teine on väärtuse tüüp HashMap<String, String> numbrid = new HashMap<>(); numbrid.put("hädaabi", "112"); numbrid.put("elektritakso", "1918"); String takso = numbrid.get("elektritakso"); // "1918"
1. rühmatöö
Lahenduste esitamine
Kuna seekord on osadele kontrollülesannete lahendustele koostatud automaattestid, on ka lahenduste esitamise kord varasemast erinev. Java failid tuleb Moodle'isse esitada eraldi, mitte kokkupakituna.
Kursuse Moodle'i avalehelt jõuate esmalt ülesande kirjelduse juurde, kust saab liikuda edasi lehtedele "Esitamine" ja "Redigeerimine". Kuigi "Esitamine" tundub pealkirja järgi ülesannete esitamiseks õigem valik, on tegelikult mitut faili mugavam esitada lehel "Redigeerimine". Valige seal nuppu "Impordi" (kastikese kohal nool suunaga üles) otsige üles enda *.java failide kaust, märkige kõik failid, mida soovite esitada ja vajutage "OK" ning seejärel redaktori nuppu "Salvesta". Kui hiljem otsustate mingit faili uuendada, siis piisab vaid selle faili uuesti importimisest (või redaktoris muutmisest).
Kontrollimise alustamiseks vajutage redaktori menüüribal "Kontrolli" (☑). Seepeale peaks ekraani paremasse serva varsti ilmuma tagasiside või kompileerimise veateated.
Esitada tuleks järgmised failid:
- SõnadeAnalüüs.java
- Lühendaja.java
- Lastehoid.java
- Lapsehoidja.java (kui kasutasid seda klassi)
- valikuliste ülesannete lahendused, mille kohta soovite juhendajalt tagasisidet
Nagu ülalpool öeldud, peavad kõik nõutud klassid olema vaikepaketis, st. vastava java faili alguses ei tohi olla package
direktiivi.
Kui mõnes esitatud failis tekib kompileerimisviga, siis jääte paraku automaatsest tagasisidest ilma. Esitatud failid jõuavad praktikumijuhendajani sellegipoolest ja ta saab omapoolse tagasiside siiski anda.